Progetti di ricerca

AnonymAI

Legal Compliant Text and Voice Anonymization through Artificial Intelligence

EU “NGI Trust” (Next Generation Internet) ha selezionato nella terza call il progetto di ricerca e sviluppo ”AnonymAI: Legal Compliant Text and Voice Anonymization through Artificial Intelligence”. Il progetto nasce dalla collaborazione di CELI con il partner “ICT Legal Consulting”, studio legale internazionale specializzato in Tutela della Privacy, Sicurezza e Diritto della Proprietà Intellettuale in ambito ICT. 

Con l’introduzione del Regolamento (UE) 2016/679 e la necessità di conformarsi ai requisiti ISO/IEC 27001, le tecnologie per la gestione dei dati personali e sensibili e il miglioramento della privacy sono diventate particolarmente rilevanti per le imprese e le pubbliche amministrazioni. Vi è quindi un crescente bisogno di metodi di anonimizzazione sicuri e veloci da applicare in domini specifici
L’anonimizzazione e la pseudoanonimizzazione sono un metodo per conservare i vantaggi dell’utilizzo dei dati – e quindi per mantenere procedure data-driven – mitigando i rischi connessi al trattamento e alla conservazione dei dati personali e sensibili. 

Nei documenti testuali possono essere infatti contenuti dati personali e sensibili, che possono essere utilizzati, direttamente o indirettamente, per identificare o risalire a un individuo: ad esempio, nelle sezioni di testo libero di sondaggi anonimi, nei report aziendali interni, nelle trascrizioni delle conversazioni telefoniche, ecc. 

Le esigenze di anonimizzazione o pseudoanonimizzazione cambiano da dominio a dominio e occorre distinguere i dati personali dalle informazioni business-relevant. Ad esempio, nel dominio medico, per condividere dati utili alla ricerca, le cartelle cliniche devono essere rese anonime rispetto ai nomi dei pazienti, dei medici e di altri identificatori personali, senza rimuovere riferimenti a trattamenti, dispositivi medici o nomi di istituzioni indispensabili per la comprensione delle scoperte e dei trattamenti clinici.

A tal fine stiamo lavorando allo sviluppo sperimentale di un prototipo di anonimizzatore automatico per testi in italiano e inglese, accompagnato da linee guida per la verifica dei requisiti legali e delle corrette procedure da seguire in termini normativi, da testare su diversi casi d’uso.

Questo servizio si rivolge ad aziende e a pubbliche amministrazioni che operano in settori diversi ma che hanno l’esigenza comune di proteggere i dati personali dei propri utenti contenuti in documenti testuali e audio.

L’anonimizzazione automatica viene effettuata mediante tecnologie di Natural Language Processing basate su apprendimento automatico e risorse linguistiche. Include inoltre dati personali comuni, come nomi propri, località, numeri ID, numeri di telefono e indirizzi e-mail) e le cosiddette “categorie speciali di dati personali”. Il servizio permetterà una configurazione precisa, l’applicazione immediata dei requisiti dell’utente e la scalabilità del sistema a nuove PII (Personal Identifiable Information) rilevanti.