
Каким образом обеспечить поиск с использованием классификации в электронной библиотеке?
Электронные библиотеки (ЭБ) формируются, в частности, путем оцифровки изданий или рукописей, принятых на хранение до создания электронных каталогов. Библиографические записи (БЗ) таких документов чаще всего находятся не только в алфавитных, но и в систематических карточных каталогах, построенных по УДК, ББК или иной классификации. Вопрос о пользе библиотечно-библиографических классификаций при поиске в электронных каталогах ЭБ рассматривался в блоге ранее. Их нередко называют «базой знаний» и относят к простым онтологиям. Нерационально заведомо идти на существенное снижение полноты поиска в ЭБ, по сравнению с имеющимися в карточных каталогах возможностями иерархического поиска с использованием классификаций.
Нужные БЗ оцифрованных документов могут быть введены в электронный каталог каждая в отдельности или в результате большого проекта ретроспективной конверсии (оцифровки) целого карточного каталога библиотеки. Допустим, с карточки будут перенесены в электронные записи и индексы классификации, но от этого практически нет никакой пользы для поиска. Кто из пользователей знает эти индексы? Почти никто.
В то же время, в мировой библиотечной практике, в том числе, и у нас, принято формировать единые ЭК для изданий и рукописей, как хранящихся в традиционном фонде библиотеки, так и в фонде ЭБ, доступном с рамках одного и того же интерфейса.
Существует, по крайней мере, 3 варианта решения задачи использования смысловых связей, зафиксированных в классификациях (не исключаем и другие возможности):
1) внести полную роспись каждого индекса классификации прямо в БЗ и таким образом сделать поисковыми словесные формулировки всех составляющих каждого индекса при тематическом поиске (по умолчанию); получается некий аналог поиска по ключевым словам с автоматическим использованием смысловых связей из тезаурусов;
2) установить в ЭК ЭБ машиночитаемую классификацию в полном виде, причем с предметным доступом ко всем уровням иерархии и выходом на библиографические записи в ЭК; при этом пользователь в результате диалога с системой, в принципе, должен конструировать индекс из составляющих, предусмотренных в таблицах; обычно используются для поиска наиболее простые конструкции индексов, уже имеющиеся в таблицах;
3) установить в ЭК ЭБ «рабочие» таблицы классификации в полном виде с предметным доступом ко всем уровням иерархии и выходом на библиографические записи в ЭК, включив все сформированные при обработке (систематизации) документов комплексные индексы с их полными словесными формулировками.
Вариант 2 можно встретить в электронных каталогах целого ряда библиотек (например, ГПНТБ России, Библиотека МГТУ им. Н.Э. Баумана).
Сложность использования данного варианта заключается в том, что самые распространённые и при этом хорошо проработанные классификации предусматривают достаточно сложные правила формирования комплексных индексов из предусмотренных в таблицах составляющих. Эти правила можно отобразить в интерфейсе для обычного пользователя Сети только достаточно условно.
Главная проблема заключается в том, что современный обитатель сети Интернет, во-первых, ценит скорость работы, во-вторых, привык к тому, что поисковые системы максимум возможностей поиска должны обеспечивать ему «по умолчанию». При этом многие не задумываются, что при выдаче 1 миллиона страниц на запрос в Яндексе действительные потери ресурсов, соответствующих теме запроса, могут составлять ориентировочно, до 90% из-за отсутствия словарей смысловых связей (иерархия, ассоциации, синонимия) между ключевыми словами.
Согласитесь, у глобальных поисковых систем свои задачи, а у электронных библиотек – свои. На то они и библиотеки, а не «стихийные» электронные ресурсы.
Российская государственная библиотека занимается реализацией вариантов 1 и 3 для обеспечения использования данных из таблиц национальной классификации ББК для поиска в электронном каталоге, включая поиск электронных ресурсов в своей электронной библиотеке. (Продолжение следует)