En


Ольга Лавренова
2 457
Ольга Лавренова

Каким образом обеспечить поиск с использованием классификации в электронной библиотеке?

Электронные библиотеки (ЭБ) формируются, в частности, путем оцифровки изданий или рукописей, принятых на хранение до создания электронных каталогов. Библиографические записи  (БЗ) таких документов чаще всего находятся не только в алфавитных, но и в систематических карточных каталогах, построенных по УДК, ББК или иной классификации. Вопрос о пользе библиотечно-библиографических классификаций при поиске в электронных каталогах ЭБ рассматривался в блоге ранее. Их  нередко называют «базой знаний» и относят к простым онтологиям. Нерационально заведомо идти на существенное снижение полноты поиска в ЭБ, по сравнению с имеющимися в карточных каталогах возможностями иерархического поиска с использованием классификаций.

Нужные БЗ оцифрованных документов могут быть введены в электронный каталог каждая в отдельности или в результате большого проекта ретроспективной конверсии (оцифровки)  целого карточного каталога библиотеки. Допустим, с карточки будут перенесены в электронные записи и индексы классификации, но от этого практически нет никакой пользы для поиска. Кто из пользователей знает эти индексы? Почти никто.

В то же время, в мировой библиотечной практике, в том числе, и у нас,  принято формировать единые ЭК для изданий и рукописей, как хранящихся в традиционном фонде библиотеки, так и в фонде ЭБ, доступном с рамках одного и того же интерфейса.

Существует, по крайней мере,  3 варианта решения  задачи использования смысловых связей, зафиксированных в классификациях (не исключаем и другие возможности):

1)      внести полную роспись каждого индекса классификации прямо в БЗ и таким образом сделать поисковыми словесные формулировки  всех составляющих каждого индекса при тематическом поиске (по умолчанию); получается некий  аналог поиска по ключевым словам с автоматическим использованием смысловых связей из тезаурусов;

2)      установить в ЭК ЭБ  машиночитаемую классификацию в полном виде, причем с предметным доступом ко всем уровням иерархии и выходом на библиографические записи в ЭК; при этом пользователь  в результате диалога с системой, в принципе, должен  конструировать индекс из составляющих, предусмотренных в таблицах; обычно используются для поиска  наиболее простые конструкции индексов, уже имеющиеся в таблицах;

3)      установить в ЭК ЭБ  «рабочие» таблицы классификации в полном виде с предметным доступом ко всем уровням иерархии и выходом на библиографические записи в ЭК, включив все сформированные при обработке (систематизации) документов комплексные индексы с их полными словесными формулировками.

Вариант 2 можно встретить в электронных каталогах целого ряда библиотек (например, ГПНТБ РоссииБиблиотека МГТУ им. Н.Э. Баумана).

Сложность использования данного варианта  заключается в том, что самые распространённые и при этом хорошо проработанные классификации предусматривают достаточно сложные правила формирования комплексных индексов из предусмотренных в таблицах составляющих. Эти правила можно отобразить в интерфейсе для  обычного пользователя Сети только достаточно условно.

Главная проблема заключается в том, что современный обитатель сети Интернет, во-первых, ценит скорость работы,  во-вторых,  привык к тому, что поисковые системы максимум возможностей поиска должны обеспечивать ему «по умолчанию». При этом многие не задумываются, что при выдаче 1 миллиона страниц на запрос в Яндексе действительные потери ресурсов, соответствующих теме запроса, могут составлять ориентировочно, до 90%  из-за отсутствия словарей смысловых связей (иерархия, ассоциации, синонимия) между ключевыми словами.

Согласитесь, у глобальных поисковых систем свои задачи, а у электронных библиотек – свои. На то они и библиотеки, а не «стихийные» электронные ресурсы.

Российская государственная библиотека занимается реализацией вариантов 1 и 3  для обеспечения использования данных из таблиц национальной классификации ББК для поиска в электронном каталоге, включая поиск электронных ресурсов в своей электронной библиотеке. (Продолжение следует)


Комментарии

Books

Мне кажется что острота проблемы заключается не только в скорости и смысловой каталогизации, но и в доступности электронных библиотек как таковых. Ибо если рядовой пользователь будет затрачивать на доступ к библиотеке много времени, то скорее он не воспользуется ее услугами. На все это будет накладывать руку финансовый вопрос, учитывая сегодняшние реалии

Лаврёнова

Спасибо за комментарий точно по сути проблемы. Вы совершенно правы, и в этом направлении наша библиотека (РГБ) серьёзно работает. Однако, согласитесь, роль хорошей семантики, качественных поисковых средств после выхода электронных билиотек в открытый доступ в Сети только возрастёт, и мы должны готовить их заранее.


Оставить комментарий

Скрыто от всех