From data
To meaning

Il Washington Post ha recentemente pubblicato un articolo nel quale si evidenziano le tecnologie più importanti che hanno cambiato il nostro modo di vivere nel corso dell’ultima decade.
Siamo alla fine di un altro decennio e l’inizio del nuovo porterà con sé nuove tecnologie e interessanti evoluzioni delle precedenti.

Abbiamo quindi deciso di ripercorrere come Intelligenza Artificiale (AI) e Natural Language Processing (NLP) hanno contribuito alla creazione di alcune di queste tecnologie. CELI opera in questo settore da 20 anni e ha contribuito alla realizzazione di progetti che hanno cambiato per sempre il mondo e soprattutto il modo di accedere alla tecnologia.

Ma veniamo alle tecnologie che ci hanno cambiato la vita.

 

1- Smart speaker ed assistenti vocali

 

Ogni volta che parliamo con Siri, Alexa o Google Home abbiamo un’interazione diretta con l’AI.

L’ascesa degli assistenti vocali è iniziata nel 2011, quando Apple ha rilasciato Siri su iPhone. Google ha poi lanciato Google Now nel 2012, seguito nel 2016 da Google Assistant. Spesso però questi assistenti vocali sono rimasti confinati agli smartphone.

Alexa di Amazon, introdotta nel 2014, ha portato all’esplosione del mercato degli assistenti vocali e ha portato l’AI in molte delle nostre case. L’introduzione, nel 2016, di Google Home ha spinto ulteriormente la crescita di questo comparto.

Qualche dato: solo nel terzo trimestre del 2019, Amazon ha spedito nel mondo 10,4 milioni di altoparlanti intelligenti che utilizzano Alexa, conquistando quasi il 37% del mercato globale per questi gadget (Canalys 2019).

 

 

Gli assistenti vocali hanno decisamente cambiato il nostro rapporto con la tecnologia: poter dialogare con una macchina è stato uno degli obiettivi dell’informatica sin dagli albori (“Computing Machinery and Intelligence” 1950, A. Turing) e una suggestione della fantascienza da sempre (basti pensare al film del 1968, “Odissea nello spazio” di Stanley Kubrick).

Quella che sembra una novità dei nostri giorni è che ogni volta che parliamo con un assistente vocale, le nostre voci vengono registrate per migliorare il loro sistema di NLU (Natural Language Understanding). Pertanto, il rapporto che in precedenza era unidirezionale, ora è diventato di aiuto reciproco: questi strumenti ci offrono i loro servizi mentre noi contribuiamo direttamente al loro miglioramento.

Alexa, Siri e Google Home ci hanno anche aiutato a sentirci a nostro agio con l’idea che ci sia una sola risposta a una domanda. Con i motori di ricerca tradizionali, ad ogni query di ricerca corrispondeva una serie di pagine che probabilmente contenevano la risposta alla nostra domanda. Se, invece, chiediamo a un assistente vocale “Vorrei cucinare una zuppa”, l’assistente ci darà indicazioni seguendo una sola ricetta, scelta automaticamente. 

Dalla ricerca ed analisi dei requisiti, attraverso il design sino alla realizzazione di prodotti Voice First a tutto tondo: CELI aiuta le aziende a gestire contesti complessi ed in continua evoluzione che comprendono l’utilizzo della voce come strumento di interazione con i clienti finali.

 

 

2- I sistemi di raccomandazione (Recommender Systems)

 

Netflix, il servizio di film e serie TV in streaming, è nato nel lontano 1997 ma solo nell’ultimo decennio ha visto il suo più grande sviluppo. Come utilizza l’AI per migliorare la nostra esperienza? 

Innanzitutto attraverso l’utilizzo della nostra watching history: attraverso degli algoritmi di raccomandazione (Recommender Systems) ci vengono mostrati i titoli che ci potranno piacere e ci convinceranno a pagare la nostra sottoscrizione mensile. Inoltre l’AI è utilizzata anche per ottimizzare lo sfruttamento di server regionali che garantiscano tempi di caricamento più rapidi anche nei momenti di picco, scegliendo i server da utilizzare basandosi sullo storico dei dati di visualizzazione.

Questa medesima tecnologia viene impiegata da tempo da Amazon, da Spotify e da Sky per migliorare l’esperienza degli utenti e  spingerli a vedere la prossima serie TV, oppure a comprare un nuovo prodotto.

Storicamente i sistemi di raccomandazione si dividono in due famiglie:

  • basati sulla similarità tra utenti: vengono creati automaticamente dei profili di utenti con algoritmi di clustering. In questo modo, individuati due utenti “simili”, è facile proporre al primo i prodotti che sono piaciuti al secondo
  • basati sulla similiarità dei contenuti: si utilizzano degli algoritmi di estrazione delle informazioni che consentono di arricchire con dei metadati i prodotti del catalogo (attori che hanno partecipato al film, classificazione per genere, data di pubblicazione, ecc). A questo punto il documento principale viene considerato come una query in un motore di ricerca semantico e i primi risultati diventano i suggerimenti del sistema.

CELI ha esperienze in entrambi i tipi di sistema.
Per realizzare un sistema di raccomandazione dei contenuti un cliente si può affidare alle tecnologie di CELI che permettono di estrarre metadati strutturati da un archivio di dati non strutturati, che siano testo, audio o video. Inoltre le nostre tecnologie di ricerca proprietarie sono facilmente personalizzabili per realizzare il motore di un sistema di raccomandazione basato su contenuti.

 

3-  Il settore automotive: Tesla model S e Mercedes MBUX

 

Il mondo dell’automotive è da sempre l’ambito in cui le innovazioni tecnologiche vengono ideate ed applicate in anticipo rispetto agli altri settori. Senza dubbio l’ultimo decennio è stato costellato da grandi innovazioni che promettono di portarci nel prossimo decennio, alla guida autonoma.

Tesla è il primo esempio che viene alla mente: un’auto concepita più come uno smartphone il cui software si aggiorna via wi-fi. Tesla raccoglie dati da tutti i suoi veicoli e dai loro conducenti, con sensori interni ed esterni che possono raccogliere informazioni sul posizionamento della mano del guidatore, sulla strumentazione e su come la utilizzano. I dati vengono impiegati per generare mappe ad alta densità di dati che mostrino tutto, dall’aumento medio della velocità del traffico su un tratto di strada, alla localizzazione di possibili elementi pericolosi, così da indurre i conducenti ad agire. 

L’apprendimento automatico nel cloud si occupa di “educare” l’intera flotta, mentre a livello di singola auto, l’edge computing decide quale azione l’auto deve intraprendere. Esiste anche un terzo livello decisionale, con le auto in grado di formare reti con altri veicoli Tesla nelle vicinanze al fine di condividere informazioni e approfondimenti locali. In uno scenario nel prossimo futuro in cui le auto autonome saranno molto diffuse, queste reti si interfacceranno molto probabilmente anche con auto di altri produttori, nonché con altri sistemi come telecamere del traffico, sensori stradali o telefoni cellulari.

Mercedes MBUX è invece il miglior esempio che mostra come il linguaggio naturale possa essere impiegato con successo in situazioni in cui le mani sono occupate.

Il sistema Mbux funziona come Siri, Alexa e l’assistente di Google, distinguendosi quindi dai sistemi presenti nelle altre auto che sono puramente esecutori di comandi vocali basilari come per esempio fare una telefonata.

MBUX, con “Hey Mercedes”, è un sistema di intelligenza artificiale che interpreta il comando, lo elabora e interagisce con l’interlocutore. Per esempio, con “Mercedes” basta dire: “Hey, Mercedes ho caldo!” e automaticamente il sistema accenderà il climatizzatore e abbasserà la temperatura dell’auto.

Gli ottimi risultati ottenuti da Mercedes sono anche frutto di una collaborazione di lunga data fra CELI e Nuance (ora Cerence per il suo branch automotive).

 

 

4- Knowledge Graph

 

I Knowledge Graph sono dei dataset che cercano di racchiudere tutte le informazioni di senso comune strutturandole in un grafo di conoscenza secondo una precisa logica formale: luoghi geografici, personaggi celebri, opere d’ingegno (film, musica, ecc.) sono collegati fra loro da archi che ne definiscono la relazione.

Con il supporto del grafo, per esempio, Google aiuta a disambiguare le ricerche, identificando entità del mondo reale piuttosto che stringhe di testo (per esempio: Verdi, il compositore, il partito o il colore, sono tre entità diverse nel grafo). Inoltre, una volta identificata l’entità cercata, il grafo permette di facilitare l’esperienza di discovery, navigando le relazioni semantiche a partire dall’entità: per esempio dal film cercato, all’attore protagonista, agli altri film girati da quell’attore o alle news che lo riguardano.

Google costruisce il suo grafo “in casa” ma ce n’è uno di pubblico dominio, sostenuto dall’organizzazione che mantiene anche Wikipedia e popolato dal crowd: Wikidata (www.wikidata.org). Il knowledge Graph di Google è popolato a partire da wikidata e Google è uno dei maggiori finanziatori del progetto. Nel 2010, Google ha donato 2 milioni di dollari alla Wikimedia Foundation. Lo sviluppo iniziale di Wikidata è stato finanziato con una donazione di 1,3 milioni di euro, un quarto dei quali arrivò proprio da Google (fonte: Wikimedia).

Anche gli assistenti vocali, in particolare Amazon, utilizzano i knowledge graph, per esempio tutte le volte che chiediamo a Google Assistant o ad Alexa  chi è un personaggio famoso, informazioni su un film, oppure indicazioni su un luogo geografico.

 

5- Comunicazione via chat

 

Nell’ultimo decennio sono indubbiamente esplose le tecnologie di comunicazione via chat. Il concetto di messaggistica istantanea ha iniziato a svilupparsi negli anni ’90, consentendo ad amici, conoscenti, colleghi e pensatori affini di tutto il mondo di connettersi in tempo reale.

Da allora, la messaggistica istantanea ha rivoluzionato il modo in cui comunichiamo e oggi oltre 2,5 miliardi di persone sono registrate ad almeno un’app di messaggistica. L’attuale esperienza di messaggistica istantanea è fluida e integra in modo intuitivo funzionalità come video, foto, voce, e-commerce e giochi con la semplice messaggistica.

Tuttavia, nonostante le straordinarie funzionalità di app dominanti come Snapchat, Facebook Messenger e Whatsapp, la tecnologia di oggi non sarebbe semplicemente possibile senza le precedenti scoperte dei loro predecessori più rudimentali.

Facebook è uno dei big che ci ha creduto di più, visto che nel 2014 ha acquisito Whatsapp, servizio per il quale propone anche la versione business, e nel 2016 ha annunciato alla sua conferenza annuale che avrebbe puntato moltissimo sulla piattaforma di Messenger per facilitare la comunicazione tra aziende e clienti (un po’ come stava già facendo WeChat in Cina).

Le piattaforme di messaggistica si sono aperte da qualche anno anche alla possibilità di utilizzare dei chatbot. Un chatbot è in grado di rispondere alla maggior parte delle domande degli utenti di un servizio senza dover coinvolgere operatori umani, solitamente contattabili tramite call center. Tuttavia è anche in grado di rendersi conto quando c’è bisogno di un’interazione più complessa e inoltrare automaticamente la conversazione a un essere umano.

 

 

In un mondo in cui vengono proposte sempre nuove tecnologie che sembrano ogni volta poter sconvolgere tutto quello che c’è stato prima di loro, il team di CELI ha imparato come si debba guardare al futuro senza mai fermarsi e senza lasciarsi ingannare da facili entusiasmi che spesso conducono ad insuccessi.
Le tecnologie di cui abbiamo parlato sono state disruptive nel corso del decennio passato.  Per questo motivo abbiamo scritto questo articolo convinti che dureranno anche nei prossimi anni, avendo ormai raggiunto un livello di maturità tale per cui non solo i big del settore possono permettersi di sperimentarle assumendone il rischio.
Allo stesso tempo i nostri ingegneri e linguisti stanno già sperimentando le ultime scoperte per offrire ai nostri clienti soluzioni ai loro problemi che siano al tempo stesso innovative e affidabili.

Vuoi saperne di più? Contattaci:

Accetto le condizioni di privacy di cui ho preso visione

 

 

Autori:
Francesca Alloatti, Computational Linguist
Matteo Amore, Computational Linguist
Mariella Borghi, Marketing Manager
Riccardo Tasso, Software Engineer
Raffaella Ventaglio, Senior Software Architect

 

 

 

Tags: , , , , , ,