home > сценарии > digital libraries
Электронные библиотеки
Продвинутый мультиязыковой поиск в электронных библиотеках и OPAC
Пользователи электронных библиотек и OPAC привыкли использовать главным образом поисковые системы Google, Yahoo для поиска информации.
Интерфейсы, предлагаемые традиционными OPAC, не спроектированы для такого рода поиска, поскольку фокусируются на каталогизировании данных, а не на их обнаружении.
CELI благодаря сотрудничеству с библиотеками и международными исследовательскими центрами (в особенности с Факультетом Компьютерных Наук Университета в Больцано) разработала программное решение, которое способно интегрироваться в уже существующие системы OPAC и в то же вpемя гарантировать эффективный поиск необходимых пользователю текстов.
Разработанное решение базируется на двух ведущих принципах:
-
Простота: сфера текста должна быть достаточно широка для того, чтобы гарантировать пользователю доступ к необходимой информации. Недавние исследования продемонстрировали, что наиболее сложные формы навигации и запросов часто используются некорректно или вообще не используются.
-
Умная обработка: система индикации и обнаружения информации в электронных библиотеках и каталогах должна обладать не только простым интерфейсом, но и передовыми технологиями, позволяющими решать не встречающиеся в обычных text retrieval проблемы.
Простота в использовании и умный анализ
Благодаря лингвистическим способностям Sophia Semantic Engine стало возможным сделать более эффективным поиск в электронных каталогах и/или коллекции текстов в электронном формате:
- лемматизация и морфологический анализ (запросы тропическое растение и тропические растения дают одинаковые результаты).
- использование тезаурусов для уточнения результатов поиска (запрос "тропическое растение" выдает среди результатов и фразы, содержащие слова "тропическое дерево" )
- автоматическое распознавание собственных имен (запрос Толстой война и мир выдаст после первого анализа в качестве результата тексты, в которых писатель автор или субъект, а не тексты, содержащие прилагательное "толстой" и существительные "война и мир")
- "взвешенная" индексация различных областей каталога и текстов в электронном формате
- интеграция различных форм тематического каталога
Мультиязыковой поиск
Большинство библиотек имеют в каталогах тексты не только на одном языке.
Кроме того, мобильность исследователей и "операторов знания" в целом возросла. В актуальном контексте, многие библиотеки столкнулись с проблемой мультиязыкового поиска.
Необходимость обеспечить мультиязыковой доступ к каталогам становиться еще более насущной в случае вывода metaOPAC на общеевропейский уровень.
Благодаря десятилетнему опыту работы в секторе "Cross Language Information Retrieval"
CELI сегодня может предложить системы для мультиязыкового подхода к электронным каталогам и электронным библиотекам, обладающие при этом той же простотой доступа, что и моноязыковые версии. Конечный пользователь просто выбирает языки, на которых написаны интересующие его книги и набирает запрос на своем родном языке.
Система выдаст оптимальные результаты для каждого из выбранных языков.
- большой выбор двуязычных словарей для перевода запросов: Итальянский, Английский, Французский, Немецкий, Польский, Русский...
- автоматическое обновление двуязычных словарей на базе запросов пользователей
- снятие семантической омонимии для идентификации верного перевода на определенном домене.
- мультиязыковое расширение поиска, призванное идентифицировать объект интереса, в том числе и если точный перевод введенных пользователем слов отсутствует в лексиконе
- независимая система каталогизирования: использование различных систем национальной классификации (например, soggettario, subject headings и т.д.) и улучшение таким образом результатов поиска - стратегия ответа на запрос при этом не зависит от используемой системы каталогизирования.