From data
To meaning

La normativa europea GDPR prevede il rafforzamento della protezione dei dati personali, chiarendo come tali dati debbano essere trattati, incluse le modalità di raccolta, utilizzo, protezione e condivisione. I documenti in linguaggio naturale, scritti o derivanti da trascrizioni vocali possono contenere diverse informazioni che necessitano di essere protette secondo la normativa vigente. L’anonimizzazione o la pseudo-anonimizzazione sono una strategia che che può essere attuata in maniera automatica, per velocizzare il processo e poter sfruttare i (big) data analytics.

EU “NGI Trust” (Next Generation Internet) ha selezionato nella terza call il progetto di ricerca e sviluppo ”AnonymAI: Legal Compliant Text and Voice Anonymization through Artificial Intelligence”. Il progetto nasce dalla collaborazione di CELI con il partner “ICT Legal Consulting”, studio legale internazionale specializzato in Tutela della Privacy, Sicurezza e Diritto della Proprietà Intellettuale in ambito ICT. 

Con l’introduzione del Regolamento (UE) 2016/679 e la necessità di conformarsi ai requisiti ISO/IEC 27001, le tecnologie per la gestione dei dati personali e sensibili e il miglioramento della privacy sono diventate particolarmente rilevanti per le imprese e le pubbliche amministrazioni. Vi è quindi un crescente bisogno di metodi di anonimizzazione sicuri e veloci da applicare in domini specifici
L’anonimizzazione e la pseudoanonimizzazione sono un metodo per conservare i vantaggi dell’utilizzo dei dati – e quindi per mantenere procedure data-driven – mitigando i rischi connessi al trattamento e alla conservazione dei dati personali e sensibili. 

Nei documenti testuali possono essere infatti contenuti dati personali e sensibili, che possono essere utilizzati, direttamente o indirettamente, per identificare o risalire a un individuo: ad esempio, nelle sezioni di testo libero di sondaggi anonimi, nei report aziendali interni, nelle trascrizioni delle conversazioni telefoniche, ecc. 

Le esigenze di anonimizzazione o pseudoanonimizzazione cambiano da dominio a dominio e occorre distinguere i dati personali dalle informazioni business-relevant. Ad esempio, nel dominio medico, per condividere dati utili alla ricerca, le cartelle cliniche devono essere rese anonime rispetto ai nomi dei pazienti, dei medici e di altri identificatori personali, senza rimuovere riferimenti a trattamenti, dispositivi medici o nomi di istituzioni indispensabili per la comprensione delle scoperte e dei trattamenti clinici.

A tal fine stiamo lavorando allo sviluppo sperimentale di un prototipo di anonimizzatore automatico per testi in italiano e inglese, accompagnato da linee guida per la verifica dei requisiti legali e delle corrette procedure da seguire in termini normativi, da testare su diversi casi d’uso.

 

Questo servizio si rivolge ad aziende e a pubbliche amministrazioni che operano in settori diversi ma che hanno l’esigenza comune di proteggere i dati personali dei propri utenti contenuti in documenti testuali e audio.

L’anonimizzazione automatica viene effettuata mediante tecnologie di Natural Language Processing basate su apprendimento automatico e risorse linguistiche. Include inoltre dati personali comuni, come nomi propri, località, numeri ID, numeri di telefono e indirizzi e-mail) e le cosiddette “categorie speciali di dati personali”. Il servizio permetterà una configurazione precisa, l’applicazione immediata dei requisiti dell’utente e la scalabilità del sistema a nuove PII (Personal Identifiable Information) rilevanti.

L’approccio adottato e il partenariato di AnonymAI portano a molteplici vantaggi:

  • integrazione tra tecnologie innovative e obblighi legali e regolamentari
  • progettazione sulla base dei reali desideri e delle reali necessità degli utenti finali 
  • centralità delle persone nella progettazione (Human-centred design)con
  • tecnologia al servizio della tutela dei diritti fornendo prodotti ed esperienze di alta qualità. 

In questo modo si promuove un uso efficace e responsabile della tecnologia, nel contesto dell’analisi e anonimizzazione dei dati, che garantisce gli interessi di tutti gli attori coinvolti.

Questo è anche l’obiettivo generale di NGI Trust, il progetto Horizon 2020 dell’Unione Europea (grant agreement n. 825618), che promuove lo sviluppo di un internet human-centric ed un ecosistema europeo più forte di ricercatori, innovatori e sviluppatori di tecnologia nel campo della privacy e delle tecnologie che rafforzano la fiducia degli utenti. L’elenco dei progetti che hanno vinto la terza call aperta di NGI Trust è consultabile a questo link

“AnonymAI project has received funding from the European Union’s Horizon 2020 research and innovation programme under the NGI_TRUST grant agreement no 825618”.

Autori: Andrea Bolioli, Roberta Iolanda Lanzi

 

Tags: , , ,