From data
To meaning

Sviluppiamo applicazioni per gli smart speakers Amazon Echo, Google Home, e non solo

 

Esce la versione italiana di Alexa, l’assistente vocale di Amazon che, integrato nei dispositivi della linea Echo, come Echo Dot, Echo Plus, Echo Spot ed Echo Sub, permette di conversare e accedere a servizi e applicativi esterni tramite comandi vocali. Il dispositivo Google Home è uscito in Italia a marzo di quest’anno.

Molti di noi usavano già Google Assistant sullo smartphone, o Siri sull’iPhone e sui dispositivi Apple, l’assistente Cortana su Microsoft, o altri assistenti vocali. Sono strumenti comodi per consultare l’agenda, aggiornarsi sulle ultime notizie dal mondo, leggere e scrivere un’e-mail, trovare la strada nella mappa, chiedere il significato di un termine, vedere il meteo, anzi sentire le previsioni del tempo. Da qualche tempo puoi chiedere all’assistente vocale di farti raccontare una storia, intrattenerti con una barzelletta, leggere l’incipit di un romanzo, ascoltare la musica, accendere e spegnere le luci di casa e il riscaldamento, ricordarti di fare la spesa. Si tratta di funzionalità “generaliste” che possono servire a tutti, se ti piace interagire con un assistente virtuale, cioè un cilindro che parla e che fa delle cose.

La novità è che adesso su questi dispositivi si possono anche sviluppare applicazioni business, cioè applicazioni ad hoc per le aziende e gli enti che vogliono mettere a disposizione dei propri clienti e utenti un servizio che utilizzi le interfacce vocali e gli smart speaker. In termini tecnici queste applicazioni si chiamano “Google Actions” se installate su Assistant e “Skill” se aggiunte ad Alexa. Tra le top skill di Alexa ci sono applicazioni editoriali, come Corriere della Sera, Il Sole 24 ore e Ansa, che permettono di leggere le notizie d’interesse tramite un semplice comando vocale mentre siamo impegnati a fare altro. Ma c’è anche GialloZafferano, che potrà essere prezioso mentre siamo alle prese con i fornelli: se dimentichiamo un passaggio della ricetta mentre abbiamo le mani in pasta, Alexa consulterà per noi il sito di cucina e ci dirà come proseguire senza bisogno che usiamo le mani.

CELI sviluppa applicazioni per smart speaker sfruttando tecnologie di Data Analysis e Natural Language Processing. Alle nostre soluzioni già esistenti se ne aggiunge un numero potenzialmente infinito: grazie al nostro team di linguisti computazionali e sviluppatori software, creiamo applicazioni multilingue sempre nuove e compatibili con la linea di device Amazon Echo, Google Home e con gli altri assistenti vocali intelligenti.

In un prossimo post descriveremo alcune delle competenze necessarie per sviluppare un’applicazione per Google Home o per Amazon Echo. Questi strumenti si presentano a prima vista come dei piccoli cilindri, ma in realtà racchiudono in sé diverse componenti tecnologiche molto avanzate, sia dal punto di vista hardware sia dal punto di vista software. Oltre a microfoni e altoparlanti, nel software sono inclusi componenti di speech recognition o trascrizione da voce a testo, sistemi di gestione del dialogo, componenti di sintesi vocale o text-to-speech, interfacce con sistemi IoT per la domotica (utilizzati nella cosiddetta “casa intelligente”).
Le competenze necessarie comprendono quindi molti aspetti del Natural Language Processing, indispensabili in tutte le fasi dello sviluppo, dal design della User Experience al rilascio pubblico dell’applicazione.

In questo post vorrei ancora accennare ad un tema molto importante nello sviluppo e utilizzo della applicazione per smart speaker, cioè la privacy, la gestione e protezione dei dati personali. Che cosa dicono i termini del servizio di Google e Amazon in questo senso? Sono a norma secondo il GDPR dell’Unione Europea (EU Generalized Data Protection Regulation)? 

E’ un tema che ovviamente non può essere trattato in modo superficiale in un singolo post, ma di sicuro possiamo già indicare quali sono i requisiti principali. I servizi degli smart speaker non trattano dati personali sensibili cioè le informazioni personali relative ad argomenti quali dati medici riservati, etnia o origini etniche, orientamento politico, credo religioso, orientamento sessuale. I dispositivi raccolgono e trascrivono le interazioni solo dopo la pronuncia delle hotword, cioè “Ok google” e “Alexa buongiorno” nel caso degli assistenti vocali di Google e Amazon. Le trascrizioni vengono crittografate e possono essere sempre cancellate dall’utente tramite le App di configurazione.

Una volta configurato l’assistente vocale, è possibile insegnargli a riconoscere la propria voce e quindi fare in modo che risponda solo quando riconosce la tua voce, per impedire ad altre persone di accedere alle tue informazioni private come le email, i promemoria, le voci del calendario del proprio account, quando una persona usa Google Home o Assistant e ha consentito esplicitamente l’accesso agli altri servizi personali forniti da GoogleE’ sempre possibile disattivare il microfono del dispositivo, così come spegnerlo completamente.

Quando creo una nuova applicazione vocale per una azienda, devo pubblicare i termini del servizio della mia applicazione e “passare” i controlli di qualità prima che la mia nuova applicazione possa essere pubblicata. Il processo è quindi simile a quello utilizzato da Apple e Google per controllare ed approvare le App per dispositivi mobile che conosciamo da anni.

Tags: , , , , ,