home

Кластеры полнотекстового поиска в распределенной информационной среде технология и проекты

?
Кластеры полнотекстового поиска
в распределенной информационной среде:
технология и проекты
Full-text retrieval clusters
in distributed information environment:
The technology and projects
С. Х. Ляпин
Университет ИТМО,
Санкт-Петербург, Россия
А. В. Куковякин
ООО «Константа»,
Санкт-Петербург, Россия
Sergey Lyapin
University for Information Technologies, Mechanics and Optics
Saint Petersburg, Russia
Alexey Kukovyakin
CONSTANTA Company,
Saint Petersburg, Russia
Рассматривается сервис-ориентированная кластеризация информационного пространства путем
создания распределенных систем с продвинутым полнотекстовым поиском, функционирующих в
архитектуре Интернет/Интранет под управлением пользовательского браузера, обращающегося к
множеству независимых серверов. Описываются ведущиеся в вышеуказанном направлении проекты, а также проектное предложение по созданию в Республике Крым междисциплинарной распределенной информационной среды с сервисами продвинутого полнотекстового поиска, ориентированными на поддержку образовательной, научной и культурной деятельности.
Доклад подготовлен при поддержке гранта РГНФ № 14-03-12017.
Ключевые слова: распределенный полнотекстовый поиск, региональная информационная среда,
кластеризация информационного пространства, Крымский поисковый кластер, функциональная интеграция ресурсов и сервисов.
Discussed is service-oriented clusterization of information environment through building distributed systems with advanced full-text retrieval operating within Internet/Intranet architecture and managed by user
browsers addressing a number of independent servers. The related projects are reviewed, as well as project
proposal to build interdisciplinary information environment with advanced full-text retrieval services in the
Republic of Crimea. The presentation is supported by Russian Foundation for Humanities’ grant No. 14-0312017.
Keywords: distributed fuul-text retrieval, regional information environment, information environment clusterization, Crimean retrieval cluster, resource and service operational integration.

1. Введение. Две тенденции развития информационной среды.

Одной из тенденций развития современной информационной среды является переход от поиска по каталогу (с последующей презентацией найденных ресурсов в виде файлов) – к предоставлению продвинутых поисковых сервисов по полнотекстовым и комбинированным ресурсам.
Эта тенденция отмечается исследователями и разработчиками для очень широкого диапазона
решаемых задач: от разработки онтологий информационных систем «электронного правительства»
и создания коллекций электронных документов по этой тематике [1] до использования сервисов
полнотекстового поиска для поддержки аналитической, образовательной и исследовательской
деятельности [2], [3], [4].

1