From data
To meaning

Sophia Search

Accedere ai contenuti informativi in maniera intelligente

Sophia Search è un motore di ricerca semantico basato su ontologie, specializzato nell’analisi semantica per la interpretazione delle informazioni riportate in testi liberi e nella classificazione di testi e documenti.

Sophia Search consente la comprensione del testo e l’identificazione dei contenuti espressi (persone, luoghi, azioni, concetti) ai fini di una classificazione e indicizzazione. Tutti i risultati delle elaborazioni sono resi disponibili con interfacce standard per l’interrogazione da parte di sistemi terzi.

Sophia Search integra un motore di classificazione, che fornisce un valido supporto sia alla classificazione di testi e documenti sia alla navigazione di collezioni documentali e knowledge base.

Sophia Search utilizza risorse proprietarie (lessico, morfologia, rete semantica) e risorse di mercato, in particolare ontologie e vocabolari aperti, così da consentire interoperabilità a livello semantico con set di dati esposti da altri soggetti, ad esempio dalla Pubblica Amministrazione (Open Data) o repository semantici online come DBPedia.

La pipeline di analisi di Sophia Search articolata su cinque passi, porta il sistema a riconoscere il significato del testo (inteso come sequenza di caratteri), identificando elementi semantici quali concetti, entità e relazioni:

  • Riconoscimento della lingua
  • Analisi grammaticale (riconoscimento, normalizzazione, e analisi morfologica delle singole parole)
  • Analisi logica (disambiguazione delle categorie lessicali, identificazione dei sintagmi e delle loro dipendenze, strutture relazionali Soggetto-Azione-Oggetto)
  • Analisi semantica profonda (identificazione di dipendenze a livello proposizionale e analisi del periodo)
  • Analisi ontologica (riconoscimento di entità e relazioni per consentire entity linking e reasoning e ricondurre concetti ed entità a vocabolari e risorse standard)

Parallelamente a questa organizzazione della pipeline di analisi (che agisce sui singoli documenti), Sophia Search è in grado di compiere approfondite analisi testuali sull’intero corpus, quali:

  • Distribuzione statistica dei termini nei documenti, e dei tipi di lemma presenti (sostantivi, aggettivi, verbi, ecc.)
  • Estrazione di keywords (termini significativi rispetto al dataset in analisi)
  • Co-occorrenza di termini
  • Clustering (raggruppamento dei documenti in classi di similarità)

Contattaci per una demo






Autorizzo il trattamento dei miei dati personali secondo la normativa sulla privacy ai sensi dell’Art. 13 D.LGS 30/06/2003, n.196 e ai sensi del D.lgs. 196/2003 e successivi