En

Ольга Лавренова
Ольга Лавренова
0 1858

Полнотекстовый поиск

Большой успех в обществе имеет иллюзия относительно того, что поиск в полнотекстовых базах данных электронных библиотек сам по себе достаточен, так как все слова в нем могут быть поисковыми. Это означает, что достаточно вести поиск прямо по текстам без дополнительных средств учета грамматики и семантики конструкций текста на естественном языке. Предлагаем развенчать эту иллюзию с теоретической точки зрения.

Ольга Лавренова
Ольга Лавренова
0 1681

Языки разметки текстов

В электронных библиотеках обычно хранятся не просто тексты как последовательность знаков. Библиотекари (а также издатели) заинтересованы в том, чтобы в цифровой форме хранились все возможные характеристики документов. Разумеется, не все сразу, но к этому следует стремиться и сохранить не только буквы, математические знаки, ноты, рисунки, но и обозначить такие структурные элементы, как заголовки, оглавления, сноски, индексы, списки литературы и т.д.

Ольга Лавренова
Ольга Лавренова
0 1640

Поиск по формальным характеристикам документа

При поиске по формальным характеристикам документа (автору, заглавию, году или месту издания и т.д.) система обрабатывает только те элементы текста (в частности, библиографической записи или встроенных в текст метаданных), метки которых соответствуют определенному виду фрагментов текста. Если нужен поиск по авторам, то система находит метки элементов данных, которые соответствуют роли «автор».

Ольга Лавренова
Ольга Лавренова
0 981

Технология компьютерного поиска по текстам

Технологическая задача компьютерного поиска по текстам, в принципе, проста: идентифицируются последовательности знаков в текстах, соответствующие запросу пользователя.

Ольга Лавренова
Ольга Лавренова
0 801

Вступление

Вашему вниманию мы хотели бы предложить тему для обсуждения – поиск информации в электронных библиотеках: иллюзии, реальность, перспективы. Мы хотим предоставлять материалы дискуссионного характера.