home > scénarios > digital libraries
Digital libraries
Recherches avancées et multilingues en bibliothèques numériques et OPAC
L'utilisateur des bibliothèques numériques ou plus simplement des OPAC est habitué à utiliser comme principale source de localisation de l'information des moteurs de recherche tels Google, Yahoo.
Les interfaces mises à disposition par les OPAC traditionnelles ne sont pas conçues pour ces types de recherche, car ils focalisent le catalogage des données plutôt que leur récupération.
CELI, grâce à la collaboration avec des bibliothèques et des centres de recherche internationaux (en particulier la Faculty of Computer and Science de l'Université de Bolzano) a réalisé un solution en mesure de s'intégrer avec un OPAC pré-existent et garantir en même temps la récupération la plus simple possible des textes désirés par l'utilisateur. L'approche est fondée sur deux principes directeurs:
-
Simplicité: une zone de texte doit être amplement suffisante pour garantir à l'utilisateur l'accès à l'information désirée. De récentes études ont montré que des formes de navigation ou d'interrogation plus complexes sont souvent inutilisées ou mal utilisées.
-
Elaboration intelligente: à l'opposée de la simplicité de l'interface un système d'indication et de récupération dans un contexte comme celui des Digital Libraries ou des E-Catalogues doivent disposer d'une technologie d'avant-garde pour pouvoir résoudre les problèmes qui ne se posent pas dans le cadre d'un text retrieval normal.
Simplicité d'utilisation et analyse intelligente
Grâce aux capacités linguistiques de Sophia Semantic Engine, il est possible d'améliorer la recherche sur catalogues numériques et/ou collections de textes en format électronique:
- lemmatisation et analyse morphologique ( la requête plante tropicale et plantes tropicales rendent les mêmes résultats)
- utilisation de thesaurus pour l'affinement de la recherche (la requête plante tropicale restitue aussi les résultats qui contiennent les mots arbres tropicaux)
- reconnaissance automatique des noms propres (la requête benedetto (béni) croce (croix) restituera en première analyse les textes du philosophes des Abruzzes dont il est auteur ou sujet, plutôt que des documents contenant l'adjectif béni ou le substantif croix)
- indication "pesée" des différents champs du catalogue et des textes en format électronique
- intégration avec les diverses formes de répertoires en usage à la bibliothèque
Recherches Multilingues
La plus grande partie des bibliothèques a également un catalogue de textes non italiens. En outre, la mobilité des chercheurs et des "opérateurs de connaissance" en général a augmenté. Dans le contexte actuel, beaucoup de bibliothèques doivent affronter le problème des recherches multilingues. La nécessité de garantir l'accès multilingue aux catalogues devient ensuite essentielle dans le cas de méta OPAC au niveau européen. Grâce à une décennie d'activité dans le secteur du "Cross Language Information Retrieval", CELI est en mesure d'offrir des systèmes d'approche multilingue des catalogues électroniques et bibliothèques numériques basés sur la même simplicité d'accès que la version monolingue. L'utilisateur final choisit simplement les langues des livres qu'il désire obtenir et insère la requête dans sa langue maternelle. Le système prend en charge la restitution de résultats optimaux pour chacune des langues sélectionnées.
- vaste gamme de dictionnaires bilingues pour la traduction des requêtes : Italien, Anglais, Français, Allemand, Polonais, Russe,…
- mise à jour automatique des dictionnaires bilingues sur la base des requêtes des utilisateurs
- désambiguation sémantique pour identifier la traduction correcte dans un certain domaine
- expansion plurilingue vouée à identifier les objets numériques intéressants même si la traduction exacte des mots émis par l'utilisateur peut être absente des lexiques
- indépendance des systèmes de catalogage: le système utilise les différents systèmes de classification nationale (par exemple répertoire, mots-clés etc.) pour améliorer les résultats, mais la stratégie de réponse à la requête multilingue ne dépend pas du type de répertoire utilisé.