From language
To knowledge

Linked Data

Tecnologie semantiche per l’architettura dell’informazione

L’approccio semantico

Con approccio semantico intendiamo l’utilizzo di tecnologie e tecniche di rappresentazione della conoscenza che provengono da due filoni di ricerca accademica e industriale: da un lato il Natural Language Processing (NLP), che oggi vanta una storia di applicazioni di alcuni decenni, a cui si affiancano più di recente le tecnologie che fanno riferimento alla visione del Semantic Web – un insieme di tecnologie e best practices supportate dal W3C (World Wide Web Consortium), la cui formulazione originale è dovuta a Tim Berners-Lee, e che vuole tendere a rendere il web non solo navigabile ma anche interrogabile in modo strutturato da applicazioni software. Questa visione si è incarnata nella nozione, compresa in quella di Semantic Web, di Linked Data.

Negli ultimi anni si è assistito a felici connubi tra tecniche NLP (sia simboliche che basate su statistica e machine learning) e Semantic Web (reasoning, rappresentazioni basate su ontologie e vocabolari controllati).

In particolare, si può vedere l’NLP come un livello di analisi su dati non strutturati (testi in linguaggio naturale) che ne fa emergere le strutture sintattiche e logiche (parti del discorso, sintagmi, frasi, ruoli funzionali e dipendenze). Su questa analisi del testo si può innestare una rappresentazione di più alto livello, che vada a esplicitare le relazioni esistenti tra testo e concetti ed entità.

La visione comune a queste due discipline è costituita da un’attenzione a rappresentare, processare, analizzare i dati (strutturati o non strutturati) rendendo il più possibile esplicito il significato implicitamente contenuto in essi. L’approccio semantico, quindi, non è costituito solo da tecnologie, ma anche da modelli e buone pratiche che facilitano l’interoperabilità (appunto, semantica) dei dati trattati.

I vantaggi dell’approccio semantico

I vantaggi di un approccio semantico per un motore di ricerca sono riassumibili come segue:

  • Maggiore efficacia della ricerca, grazie a tecniche NLP che consentono di cercare parole chiave per forme varianti (forme non standard, singolari/plurali, sinonimie ecc)
  • Aumento della trovabilità attraverso un sistematico utilizzo di suggerimenti e auto-completamenti basati sul vocabolari di dominio
  • Discovery dei contenuti per far emergere contenuti altrimenti nascosti nella mole dei dati non strutturati
  • Linking tra testo e concetti e entità, per arricchire i documenti con informazioni enciclopediche e relazioni tra i concetti coinvolti
  • Navigazione tra i contenuti in una forma comprensibile e accattivante per l’utente

L’approccio semantico fornisce, inoltre, un complessivo vantaggio in termini di architettura dell’informazione, consentendo utilizzo uniforme delle risorse di annotazione (lemmario, tassonomie, sinonimi) in un’ottica di arricchimento, interoperabilità e riuso dei contenuti.

Contattaci per una demo





Autorizzo il trattamento dei miei dati personali secondo la normativa sulla privacy ai sensi dell’Art. 13 D.LGS 30/06/2003, n.196 e ai sensi del D.lgs. 196/2003 e successivi