En


Ольга Лавренова
0 1531
Ольга Лавренова

Тематический (предметный) поиск. Терминологические проблемы

Прежде, чем заняться анализом различных средств поиска, целесообразно  уточнить основные термины. Предлагается в рассуждениях по проблемам тематического поиска быть особенно внимательными к сути вещей, т.е. обсуждаемых понятий и терминов.

В частности, полезно понимать, что словосочетания «тематический поиск» и «предметный поиск»  в данной сфере деятельности выражают эквивалентные понятия, имея, кстати, один аналог в терминологии на английском языке – «subject search». Если мы обратимся к исходным значениям слова «subject», проверив переводы по англо-русским словарям, то в качестве первого перевода увидим слово «тема», затем «предмет разговора», «сюжет», далее – «подлежащее», «субъект», «предмет», «объект», «лейтмотив» (муз.)  и т.д. Это подтверждает правомерность перевода названия режима поиска «subject search» и как «тематический поиск», и как «предметный поиск». Соответственно, поля форматов MARC21, RUSMARC, UNIMARC  для представления в электронных каталогах тех элементов библиографических записей (БЗ), которые отражают тему, предмет документа, предназначены для любых «тематических терминов» subject terms», как пишут в современных текстах форматов и других специальных публикациях).

В то же время, в отечественной библиотечной практике процветает иллюзия, будто такие поля форматов созданы исключительно для предметных рубрик (subject headings), если предполагаются контролируемые точки доступа к БЗ, или для свободных ключевых слов, если значения поля не контролируются по словарю, хотя и те, и другие являются всего лишь разновидностями средств выражения темы документа. Иллюзия только кажется безобидной, но она нередко встает на пути развития оригинальных средств поиска.

На самом деле, при тематическом поиске различаются только контролируемые и неконтролируемые точки доступа к БЗ (т.е. документам) по темам. Неконтролируемыми точками доступа могут быть ключевые слова или даже словоформы (при полнотекстовом поиске), а контроль точек доступа для поиска по темам может осуществляться по файлам предметных рубрик, файлам имен лиц или наименований организаций, онтологиям, классификациям (словесным формулировкам классификационных индексов), тезаурусам (дескрипторам) и любым другим словарям, которые смогут выполнять роль средства контроля точек доступа в будущем.

Сферу деятельности по созданию средств контроля и расширения возможностей тематического поиска называют в современных работах по электронным библиотекам «организацией знаний» (knowledge organization).  В этой сфере прослеживаются четкие тенденции к интеграции различных средств представления знаний   – иерархических классификаций, предметных рубрик, терминологических словарей, тезаурусов, причем преимущественно на базе последних. При этом структура предметных рубрик постепенно стирается как таковая и приближается к виду последовательностей.

Интересной представляется интерпретация  термина «тема произведения» в недавно опубликованном под эгидой ИФЛА документе «Functional Requirements for Authority Data. Conceptual Model», который РБА планирует издать на русском языке под заглавием  «Функциональные требования к  нормативным/авторитетным данным. Концептуальная модель». В документе дано такое определение: «Тема произведения  – Тематические аспекты произведения и его содержание.  Включает информацию о теме/предмете произведения. Включает классификационные индексы».

Приведенные выше рассуждения позволяют нам далее обсуждать тематический поиск (subject search) в широком смысле этого термина, рассматривая всевозможные средства обнаружения признаков темы в тексте документа или в его метаданных, а также  способы их контроля.

Кстати, термин «метаданные» будем использовать в его исходном значении: данные о данных. К сожалению, в последние десятилетия сформировалась привычка называть метаданными только данные Dublin core . Однако метаданные, созданные для текста документа и отражающие его тему (темы), могут быть построены в соответствии с любой из возможностей, описанных в рамках темы № 6 нашего блога, и структурированы различными формальными методами: в MARC-формате для библиографических данных (см. тему № 2 блога) или с помощью языка разметки текста (см. тему № 3 блога) как отдельные или встроенные метаданные.

Средства контроля и расширения возможностей поиска по теме (например, в форме словарей, классификаций) в качестве метаданных по отношению к точкам доступа по темам могут быть представлены в  MARC-форматах для нормативных данных, с помощью языка разметки текста или каким-то иным способом.


Оставить комментарий

Скрыто от всех