Enterprise search 2.0
Recupero dei documenti più efficace grazie all'analisi semantica
CELI integra le
tecnologie semantiche nel motore di ricerca DocDigger.
DocDigger analizza il contenuto di portali e knowledge base e mette a disposizione dell'utente finale nuove e più efficaci
modalità di recupero dei documenti contenuti.
Il principale punto di forza di DocDigger è dato dalla sua capacità di fornire risultati ottimali
in domini specializzati. A differenza dei motori di ricerca generalisti, quali quelli presenti
su internet, DocDigger è in grado di comprendere in una certa misura i documenti
disambiguando i termini in funzione del dominio di ricerca.
Ciò consente, ad esempio, di fare la distinzione tra il significato botanico di vite,
quello meccanico e quello biologico (plurale di vita).
Deve la sua precisione all'integrazione di tecnologie di analisi semantica che rappresentano il punto di arrivo di
decennali attività di ricerca e sviluppo.
In particolare, conformemente alle più recenti indicazioni provenienti dal mondo accademico,
integra tecniche di analisi simbolica (che utilizzano dizionari, grammatiche, thesaura, ecc.)
con algoritmi di analisi statistica volti a supportare processi quali la classificazione automatica dei documenti,
la clusterizzazione ecc.
Dal punto di vista dell'utente finale, tale integrazione si concretizza in una maggiore precisione nel
recuperare i documenti rilevanti e in una riduzione dei tempi di ricerca
Caratteristiche di DocDigger
Grazie alle capacità linguistiche di Sophia Semantic Engine, è possibile migliorare la ricerca su
portali e knowledge base.
- Ricerca in testo libero (consente di identificare le
parole chiave immesse dall'utente a prescindere dalla loro flessione morfologica).
- Individuazione dei
concetti che più frequentemente occorrono nei documenti e loro utilizzo come
chiave ulteriore di ricerca.
- Riassunto automatico dei concetti presenti in un documento (Snapshot View).
- Espansione per similarità concettuale.
- Possibile vista per categories.
- Classificazione automatica.
- Clusterizzazione (raggruppamento dei documenti in classi di similarità non decise a priori dall'utente)
- Estrazione automatica di entità e loro utilizzo in fase di ricerca (es.: indirizzi email, date, nomi di aziende, nomi di persona, cifre, ecc. )
- Multilingualità (lingue attualmente disponibili, con diversi livelli di specializzazione: Italiano, Inglese, Francese, Spagnolo, Catalano, Portoghese, Tedesco, Olandese, Svedese, Norvegese, Finlandese, Danese, Polacco, Russo, Bielorusso, Estone, Lettone, Lituano, Ucraino, Greco, Turco, Arabo, Ebraico, Armeno, Albanese, Croato, Serbo-Croato, Ceco, Slovacco, Sloveno, Rumeno, Bulgaro, Ungherese, Cinese, Giapponese)
Facet browsing
DocDigger è basato sulla metodologia di classificazione a faccette (faceted classification).
che consente di superare i limiti delle tassonomie tradizionali.
Questa metodologia introduce un approccio multidimensionale, sulla base del quale
i contenuti sono descritti in funzione di molteplici "sfaccettature", e possono essere trovati
secondo molteplici criteri.
La classificazione multidimensionale aumenta la facilità d’uso dei contenuti,
e grazie alla tassonomia navigabile offre spunti e suggerimenti impliciti per ulteriori percorsi di ricerca,
avvicinandosi ai bisogni ed alle aspettative degli utenti.