home > scenari > digital libraries
Digital libraries
Ricerche avanzate e multilingue in biblioteche digitali e OPAC
L'utenza delle biblioteche digitali o più semplicemente delle OPAC è abituata ad usare come principale
fonte per il reperimento dell'informazione motori di ricerca quali Google, Yahoo.
Le interfacce messe a disposizione dalle OPAC tradizionali non sono progettate per queste tipologie di ricerca,
dal momento che focalizzano la catalogazione dei dati piuttosto che il loro reperimento.
CELI, grazie alla collaborazione con biblioteche e centri di ricerca internazionali (in particolare con la Faculty of Computer Science dell'Università di Bolzano) ha realizzato una soluzione in grado di integrarsi con un'OPAC pre-esistente e garantire al tempo stesso il recupero più semplice possibile dei testi desiderati da parte dell'utente.
L'approccio è basata su due principi guida:
-
Semplicità: una text area deve essere ampiamente sufficiente per garantire all'utente l'accesso all'informazione desiderata. Studi recenti hanno dimostrato che forme di navigazione o interrogazione più complesse sono sovente inutilizzate o mal utilizzate.
-
Elaborazione intelligente: a dispetto della semplicità dell'interfaccia un sistema di indicizzazione e recupero in un ambito come quello delle Digital Libraries e degli E-Catalogues deve disporre di tecnologie all'avanguardia per potere risolvere quei problemi che non si pongono nell'ambito di un normale text retrieval.
Semplicita' di uso e analisi intelligente
Grazie alle capacità linguistiche di Sophia Semantic Engine, è possibile migliorare la ricerca su
cataloghi digitali e/o collezioni di testi in formato elettronico:
- lemmatizzazione ed analisi morfologica (le query pianta tropicale e piante tropicali restituiscono i medesimi risultati)
- utilizzo di tesauri per l'affinamento della ricerca (la query piante tropicali restituisce anche risultati che contengono le parole alberi tropicali)
- riconoscimento automatico dei nomi propri (la query benedetto croce restituirà in prima analisi i testi di cui il filosofo abruzzese è autore o soggetto, piuttosto che documenti contenenti l'aggettivo benedetto ed il sostantivo croce)
- indicizzazione "pesata" dei vari campi del catalogo e dei testi in formato elettronico
- integrazione con le varie forme di soggettario in uso presso la biblioteca
Ricerche Multilingue
La maggior parte delle biblioteche ha in catalogo anche testi non in italiano.
Inoltre la mobilità dei ricercatori e degli "operatori di conoscenza" in generale è
cresciuta. Nel contesto odierno, molte biblioteche debbono affrontare il problema delle ricerche multilingue.
La necessità di garantire accesso multilingue ai cataloghi diventa poi essenziale nel caso di meta OPAC a livello europeo.
Grazie ad un decennio di attività nel settore del "Cross Language Information Retrieval",
CELI è in grado di offrire sistemi per l'approccio multilingue a cataloghi elettronici e
digital libraries basati sulla medesima semplicità di accesso offerta dalla
versione monolingue. L'utente finale sceglie semplicemente le
lingue dei libri che desidera recuperare e digita la query nella sua lingua madre.
Il sistema si fa carico di restituire i risultati ottimali per ciascuna delle lingue selezionate.
- vasta gamma di dizionari bilingui per la traduzione delle queries: Italiano, Inglese, Francese, Tedesco, Polacco, Russo...
- aggiornamento automatico dei dizionari bilingui sulla base delle queries degli utenti
- disambiguazione semantica per identificare la traduzione corretta in un certo dominio
- espansione plurilingue volta ad identificare gli oggetti digitali di interesse anche qualora la traduzione esatta delle parole immesse dall'utente fosse assente nei lessici
- indipendenza dal sistema di catalogazione: il sistema usa i vari sistemi di classificazione nazionale (ad esempio soggettario, subject headings ecc.) al fine di migliorare i risultati, ma la strategia di risposta a query multilingue non dipende dal soggettario utilizzato