From data
To meaning

I dati non strutturati sono, in genere, dati costituiti da testi: le risposte aperte alle survey, le conversazioni sui social media, le email, le note degli operatori di contact center, le recensioni online, i messaggi di chat, le telefonate registrate e le relative trascrizioni, i documenti, i contratti e le analisi di mercato. 

Visto il sempre maggiore utilizzo di applicazioni e servizi digitali, le informazioni non strutturate stanno crescendo rapidamente e costituiscono ormai l’80%-90% dei dati aziendali. Questo significa che le aziende dispongono di una miniera di informazioni preziose che però spesso, rimangono non valorizzate, anche per la difficoltà di analisi intrinseca in questa tipologia di dati.

Del resto, mentre da anni aziende e organizzazioni fanno buon uso dei loro dati strutturati, con metodologie e strumenti collaudati, i dati non strutturati costituiscono un patrimonio ricco di opportunità ancora inespresse. Sono infatti una fonte sostenibile di miglioramento della performance aziendale, riduzione del rischio, soddisfazione del cliente, innovazione del business, e in ultima analisi di profitto. Messi in relazione con i dati strutturati, forniscono informazioni più intelligenti e aiutano a concentrarsi su opportunità di business ancora non realizzate.

Dati strutturati vs dati non strutturati

I dati strutturati sono informazioni di tipo numerico o che comunque appartengono a un range chiuso di variabili. Sono dati semplici da analizzare in quanto organizzabili in formati predefiniti come Excel o contenuti in un database. 

Tra gli esempi di dati strutturati possiamo trovare: un voto numerico all’interno di un questionario, una variabile anagrafica (età, posizione geografica), il valore di spesa media di un determinato cliente, ecc. 

I dati non strutturati, in generale, contengono informazioni che non possono essere immediatamente organizzate in un grafico o in una tabella, e che perciò richiedono una serie di elaborazioni preventive. Sono dati solitamente ricchi di testo. Prendiamo, per esempio, le  risposte ad una survey, per esempio, potrebbero contenere opinioni, emozioni, ma anche consigli sulle funzionalità di prodotti e servizi. Nonostante l’enorme valore contenuto in questa tipologia di informazioni, la loro elaborazione è tuttavia complessa: è necessario innanzitutto estrarle, poi classificarle ed infine analizzarle per ottenere insight utilizzabili.

Come analizzare i dati non strutturati

Analizzare i dati non strutturati è difficile ma non impossibile. Anzi, la tecnologia rende possibile ciò che manualmente è particolarmente complesso ottenere. Si potrebbe infatti pensare che l’analisi e la lettura dei dati testuali sia un’attività gestibile manualmente da un essere umano. In realtà, ciò è praticamente inattuabile su grandi quantità di dati, dove le macchine: riducono le tempistiche di elaborazione, garantiscono coerenza dell’analisi e liberano le persone da un’attività ripetitiva.

In quest’ottica, le piattaforme di Speech & Text Analytics:

  • estraggono e classificano i contenuti espressi in linguaggio naturale derivanti testi liberi e conversazioni
  • comprendono le strutture linguistiche e tutte le sfumature tipiche della comunicazione umana 
  • possono estrapolare informazioni, schemi e modelli ricorrenti.
  • uniscono i dati non strutturati a quelli strutturati, supportando l’automazione dei processi e il decision making.

Gli strumenti di Speech & Text Analytics combinano il Natural Language Processing (NLP) con il Machine Learning per comprendere ed elaborare i dati testuali e generano modelli che possono essere addestrati per settori o ambiti specifici.

I vantaggi dell’adozione di piattaforme di analisi dei dati non strutturati sono molteplici: ne abbiamo parlato in modo approfondito in questo articolo

La tecnologia, da sola, non è tuttavia sufficiente: un qualunque strumento di Speech e Text Analytics deve comunque essere inserito in un processo organico e iterativo che consenta di produrre insight accurati e affidabili.

1- Raccogliere tutti i dati da analizzare, coerenti con la domanda per la quale si cerca una risposta. Una domanda relativa al brand della tua azienda potrebbe ottenere commenti sui social media o recensioni su piattaforme di e-commerce. Diversamente, una domanda orientata al prodotto o al servizio potrebbe portarti a raccogliere un insieme di risposte relative a un sondaggio sulla soddisfazione dei clienti.

2- Estrarre: porta alla luce le informazioni più rilevanti organizzando e preparando i dati. Sophia Analytics permette di scoprire i contenuti dei documenti in maniera del tutto automatica grazie ad algoritmi di Machine Learning, impostare le tassonomie, addestrare dei modelli di Deep Learning, creare un lessico di sentiment, ecc.

Estrarre si riferisce anche all’analista che, proprio in questa fase, inizia ad esplorare i dati e a comprendere i fenomeni (trend, numerosità, ragioni di preferenza o meno di un prodotto, ecc.).

3- Analizzare: fai emergere criticità e punti di forza contenuti nei dati. 

Il commento, lasciato da un cliente, con un voto NPS (Net Promoter Score) = 8: «Perché ora per poter parlare con voi bisogna prendere appuntamento, per farlo bisogna telefonare, ma al telefono non rispondete e inoltre le spese accessorie sul conto sono troppo alte. Positivo invece il sito online che pare funzionare bene» permette di cogliere diversi aspetti:

  • il sentiment del cliente è negativo
  • la classificazione, che potrebbe essere: Appuntamento, Difficoltà di contatto al telefono, Costi Conto Corrente, Funzionamento Internet Banking
  • Le opinion sono una positiva (sito online) e due negative (non rispondete al telefono, le spese accessorie sono alte)

Le informazioni che emergono dall’analisi dei dati testuali è pertanto davvero ricca di informazioni preziose per il business. Per un approfondimento su sentiment e opinion, ti consigliamo questo articolo.

4. Agire

Una volta effettuate le analisi i risultati devono essere valorizzati per dare impulso ad azioni correttive e devono essere indirizzate alle persone giuste, nel momento giusto. Un’azienda che sfrutta al meglio i risultati delle analisi dei dati non strutturati affronta i problemi in modo sistematico attuando miglioramenti sia ai prodotti/servizi che ai processi.

5. Verificare

L’ultimo step del framework di analisi dei dati non strutturati consiste nel verificare che le azioni di miglioramento abbiano effettivamente portato ad un cambiamento positivo. Le azioni intraprese devono pertanto essere validate attraverso con una nuova raccolta di dati (una nuova survey, delle email recenti pervenute al servizio clienti, ecc).

Quando i risultati possono essere analizzati nel loro insieme, combinando dati strutturati e non, è più semplice prendere decisioni data-driven. Inoltre, l’adozione delle soluzioni di Speech & Text Analytics favorisce l’avvio di un processo di cambiamento culturale e di trasformazione digitale e, in generale, una maggiore coerenza nel trattamento delle informazioni gestite.

Autori: Mariella Borghi e Matteo Amore

Tags: , , ,