En


Ольга Лавренова
0 802
Ольга Лавренова

Вступление

Вашему вниманию мы хотели бы предложить тему для обсуждения – поиск информации в электронных библиотеках: иллюзии, реальность, перспективы. Мы хотим предоставлять материалы дискуссионного характера.

Основные понятия Вам должны быть известны, как специалистам в этой области, но, тем не менее, некоторые термины потребуется уточнить, так как их смысл с течением времени потерял свою сущность. Предлагаем посмотреть на технологию информационного поиска в электронных библиотеках с холодным вниманием и без лишних эмоций, без избыточного груза распространенных мнений. С нашей точки зрения, создатели электронных библиотек нередко опираются, прежде всего, на свои собственные представления об информационном поиске, об алгоритмах поиска и оставляют потребности пользователя на втором плане. В ходе обсуждения предложенной темы мы постараемся показать это на конкретных примерах. Знаете в чем сходство технологии информационного поиска и медицины? В них почти все разбираются, уверенно критикуют решения специалистов и тоном опытного человека дают полезные советы. При этом мало кто вникает в то, как средства и методы повлияют на информационную и физиологическую систему в целом.  НО поскольку специальных знаний у советчика, как правило, не хватает, происходит путаница. Мы предлагаем основываться на профессиональных знаниях в сфере информационных технологий, а также на конкретных примерах как удачного, так и неудачного информационного поиска. При этом мы рассчитываем от вас получить интересные примеры, как убедительные, так и спорные. В практике электронных автоматизированных библиотек полно расхожих иллюзий о простых и универсальных способов решения информационных задач, также как в быту много иллюзий о лечении заболеваний простыми подручными средствами. Все рассуждают: «Соседу подошло, значит и мне пригодится». То же происходит и в информационных технологиях. Итак, рассмотрим пять иллюзий, которые мы будем обсуждать.

Иллюзия № 1 – массовая иллюзия. Это поиск в полнотекстовых базах данных электронных библиотек сам по себе достаточен. А почему? Да потому что там все слова поисковые и их ужасно много в тексте.  В эту концепцию входят два основных мифа – о возможности обойтись без программного определения роли элементов текста, нужно отказаться от меток и форматов, в то время как метки и форматы позволяют определить роль элемента в тексте, где автор, где заглавие, где адрес хранения и т.д. К счастью, эта идея быстро исчезла в пространстве и все убедились в непродуктивности такой мысли. Но вот вторая идея процветает, это идея о достаточном качестве семантического поиска, без учета грамматики и семантики, то есть смысловой стороны конструкции текста на естественном языке. Эта иллюзия, при всей ее абсурдности, как ни странно, требует серьезного анализа и опровержения. Иллюзия по поводу теоретически неограниченных возможностей поиска информации вызвана ничем иным как эйфорией от богатых массивов полнотекстовых электронных документов и выдающихся мощностей современных компьютерных систем.  При этом не учитывается, что естественные языки, на которых написаны все тексты, функционируют по собственным законам. Формулизации эти законы очень трудно поддаются.

Рассмотрим иллюзию № 2 – пользовательская, самая опасная для информационного поиска. Системы, будь то электронный каталог, библиотека или другая система, мне выдала, думает пользователь, все или почти все документы по моему запросу. И он в этом убежден. Но на самом деле имеющиеся в системах поисковые средства в принципе не могут обеспечить его полноту. Наше мнение заключается в следующем. Библиотеки не вправе вводить пользователя в заблуждение, не давая четкого описания содержательных и временных характеристик своих баз данных, не давая понятную информацию о возможностях поиска и, главное,  о тех потерях, которые ожидают пользователя при использовании тех средств, которыми обладает данная система.

Иллюзия №3 – библиотечная, так я ее называю. Если в мире многие библиотеки используют данное средство семантического поиска, то и нашим пользователям оно подойдет. Наше мнение таково. Да, необходимо использовать все ресурсы, имеющиеся в традиционных библиотеках, в электронных каталогах традиционных библиотек, но, тем не менее, их следует развивать в электронной среде, не оглядываясь на то, что другие этого еще не придумали. Не так просто быть первыми, это знают все, но это, в данном случае, целесообразно. В частности, некоторые иллюзии об использовании индексов классификации без их расшифровки, а также предметных рубрик для поиска в электронных каталогах уже тают на наших глазах  и побуждают библиотеки искать нетрадиционные решения.

Иллюзия №4, я ее называю интерфейсной. Интерфейс системы должен нравиться разработчику. Так подспудно полагают многие создатели электронных библиотек. Но пользователь электронных библиотек в сетях удивительно разнообразен. Как подстроиться к каждому человеку, если ты его не видишь и не знаешь? Какими бы замечательными средствами поиска мы не обладали, пользователю системы они могут быть не видны, не понятны, они не могут их оценить по достоинству. Поэтому большое значение имеет структура интерфейса пользователя. Если говорить откровенно, то подоплека неизбежного отношения создателей электронных библиотек к интерфейсам пользователей и отказ от серьезных понятных средств является следующей неправильная мысль. «Незачем выдумывать всякие фокусы, пользователь должен сам разобраться, если ему надо, всем не угодишь». И эта мысль процветает повсеместно. Предлагается обсудить вопросы построения интерфейса пользователя электронных библиотек, исходя из сентенции совершенно другого рода. Мы работаем для пользователя. А не он для нас. Он нам ничего не должен. Предлагается разобраться, какие формы предоставления способов поиска электронных библиотек удобны для пользователя, с учетом ограниченности времени работы в сетях, во-первых, а во-вторых, с учетом современных привычек пользователя Интернета. Об этом уже пора думать библиотекам.

Последняя иллюзия, №5, историческая. Считается, что все информационное сообщество заинтересованно в развитии средств поиска, особенно семантического. Причем занимается этим более 50 лет. Но. Действительно практика информационного поиска имеет богатую теоретическую основу, разработанную в середине прошлого века, и этот век может похвастаться огромными теоретическими достижениями, по сути, информационные технологии в этом веке и выросли. К сожалению, в новом веке вместо совершенствования средств поиска, наблюдается упрощение всех проблем. Тем самым получается возвращение к ситуации опытов 60-х годов, когда проблемы качества поиска возникали в практической работе и составляли на ходу совершенство технологии. Зачем нам к этому возвращаться, неизвестно.


Оставить комментарий

Скрыто от всех