Amazon har gjort det lettere at tilføje lyde til brugerdefinerede Alexa-færdigheder

Jeg er anerkendt som en Amazon Alexa Champion og har offentliggjort mere end tyve brugerdefinerede færdigheder på platformen. Jeg fortsætter med at lede efter nye måder at strække denne teknologi på, og en af ​​de bedste måder, jeg har fundet for at forbedre brugeroplevelsen, er ved at tilføje lyde. I betragtning af den nylige forbedring af Amazon Alexa-platformen er dette netop blevet endnu lettere. Her er en kort gennemgang af, hvordan du kan udnytte denne nye funktion.

Sådan fungerer Amazon Alexa

Alexa-platformen har muligheden for at aktivere brugerdefinerede færdigheder lavet af tredjepartsudviklere. Der er nu mere end 30k af dem tilgængelige, og de millioner af Alexa-brugere kan aktivere dem på deres enheder. Disse spænder fra at bestille en pizza fra en populær kæde til at afspille lyde for at hjælpe med at sove.

Arkitekturen for disse brugerdefinerede færdigheder har to komponenter. Den første er stemmekomponenten, der udnytter maskinlæringsmodellerne på Alexa-platformen. Dette oversætter de talte ordanmodninger til et sæt instruktioner.

Den anden komponent er if / then / else-logikken, der bestemmer, hvilket svar der skal komme tilbage til brugeren. Dette er hostet på en AWS Lambda-funktion.

For at forbedre færdighederne kan der bruges yderligere AWS-tjenester såvel som tredjepartsværktøjer. Dette inkluderer optagelse af brugerdefinerede MP3-lyde og grafik, der kan udnyttes af Lambda-funktionen.

For at tilføje lyde uploades MP3-filer til en S3-bucket, og den relevante adgangspolitik anvendes, så den kan læses af en Alexa-enhed.

Udfordringer med at tilføje brugerdefinerede lyde

En af hindringerne for adgang til at inkludere lyde i brugerdefinerede færdigheder har været evnen til at optage lyde af høj kvalitet. Disse lyde skal matche de nøjagtige standarder for platformen, inklusive bithastighed og samplingshastigheder. Dette kan gøres gennem lydredigeringsekspertise ved hjælp af software som Audacity, men tilføjer tid til at udvikle færdighederne.

Optagelse af lyde i høj kvalitet kan også være en udfordring. Der er apps til mobile enheder, der muliggør optagelse, men adgang til en lang række lyde er vanskelig. For eksempel optagelse af et flys brøl eller den lyd, som en elefant afgiver.

Alternativt kan en Alexa-udvikler søge efter lyde, der er blevet optaget af andre. Der er nogle arkiver på internettet, der har disse, men de fleste koster penge at licensere og kræver omprøvning med software som Audacity for at få de rigtige lydattributter.

Gratis MP3-indhold

Amazon har nu offentliggjort et katalog med hundredvis af lyde, der allerede er optaget under de nøjagtige standarder, der kræves af platformen. Ligesom i arkitekturdiagrammet ovenfor offentliggøres de i en S3-spand på AWS og kan bruges af enhver brugerdefineret færdighed.

Den komplette liste findes på udviklersiden, og her er hovedkategorierne.

Sortimentet er ekspansivt. Motorcykelmotorer, fyrværkeristøj og bjørnenes brøl er lige ved hånden. Der kræves ingen royalties for at bruge disse, og omkostningerne ved download af lydklip debiteres ikke din AWS-konto.

Sådan bruges lyd i en grundlæggende færdighed

Hvis du lige er kommet i gang med Amazon Alexa, skal du starte med de grundlæggende skabeloner fra Alexa GitHub-siden. Dette inkluderer opbygning af en triviafærdighed, faktafærdighed eller enkle gættespil. For eksempel offentliggjorde jeg for nylig en sjov børnefærdighed kaldet påskeægjagt. Her er den komplette repo på GitHub, herunder både Lambda-funktionen såvel som intentionmodellen.

Med et hvilket som helst af meddelelsens svar kan du tilføje SSML-syntaksen for at inkludere linket til MP3-filen i S3-bucket. Her er et eksempel fra Welcome Handler til færdigheder med påskeæg.

// This is the initial welcome message var welcomeMessage = "Welcome to the Easter Bunny Egg Hiding Game. I will ask you multiple questions that you should answer yes or no. Based on your choices, I will make a recommendation on where to hide an egg. Are you ready to begin?"; this.emit(':ask', welcomeMessage, repeatWelcomeMessage);

Når brugeren først påberåber sig denne brugerdefinerede færdighed, spiller Alexa-enheden lydklippet til trompetbuglen og læser derefter syntaksen med standardstemmen.

Klar til at komme i gang?

Gå videre og tilmeld dig en gratis udviklerkonto på Amazon, og begynd at opbygge din første færdighed i dag! Amazon-udviklerbloggen har nogle gode ressourcer til at udnytte dette emne, herunder dette nylige indlæg, der giver ideer til, hvordan man bruger dette nye indhold.