From data
To meaning

CELI è salita per ben due volte sul podio della Reply’s AWS DeepRacer nel giro di una settimana.

Abbiamo partecipato alle gare di auto a guida autonoma tenutesi rispettivamente a Torino il 27 giugno (durante l’Italian TechWeek) e a Milano il 3 luglio, ottenendo grandi risultati e conservando il ricordo di un’esperienza senza precedenti in un ambiente vibrante e ricco di appassionati di Reinforcement Learning (RL).

CELI ha una esperienza ventennale in ambito Natural Language Processing e ha quindi al suo interno molti esperti di Machine Learning applicato al linguaggio. Tre giovani del team si sono messi alla prova in questo contesto differente e hanno progettato gli algoritmi che ci hanno portato al successo.

La competizione consiste nel far gareggiare dei modelli di auto a guida autonoma in scala 1/18, costruite ed addestrate attraverso modelli di Reinforcement Learning. La gara è a tempo: si hanno a disposizione 4 minuti per compiere almeno un giro del percorso nel minor tempo possibile con un modello di RL stabilito. All’auto a guida autonoma di ogni partecipante sono permesse non più di 3 uscite dal tracciato di gara – pena l’annullamento del tempo sul giro.

Il team CELI è riuscito a conquistare l’intero podio della gara di Torino, mentre nella gara di Milano si è assicurato il terzo posto!

Le auto a guida autonoma sono veicoli in grado di muoversi basandosi esclusivamente sui segnali trasmessi dai sensori – come ad esempio radar, sonar e sistemi GPS – posti sul veicolo, senza alcun aiuto o input proveniente da un essere umano. Uno specifico algoritmo interpreta le informazioni ricevute dal veicolo, individuando il percorso migliore da seguire ed evitando, nel mentre, eventuali ostacoli.

I modelli di auto funzionano grazie all’addestramento di modelli di Reinforcement Learning. Il RL è un’area del Machine Learning basata sulla creazione di software con capacità decisionali fondate sullo stato corrente dell’ambiente in cui l’agente si trova, percepito tramite alcuni sensori. Obiettivo dell’agente è muoversi all’interno dell’ambiente massimizzando una funzione, detta di reward, che può premiare o punire l’agente in base alla natura corretta o sbagliata dell’azione compiuta per lo scopo impostato.

Insieme all’Addestramento Supervisionato e all’Addestramento Non Supervisionato, il Reinforcement Learning è uno dei tre paradigmi di base del Machine Learning.

Per saperne di più sulle nostre attività di Natural Language Processing, Machine Learning e Reinforcement Learning e per richiedere informazioni, contattaci all’indirizzo info@celi.it.