En


Михаил Шварцман
6 3265
Михаил Шварцман

Дополнительные критерии оценки ЭБС

Как я писал ранее, ни одна ЭБС по своему содержанию не удовлетворяет всем потребностям вузов. Поэтому учебному заведению, особенно крупному, необходимо подписываться на несколько ЭБС одновременно. Кроме того, как правило, у вуза есть своя собственная электронная библиотека. А значит, очень важным критерием ЭБС является возможность ее интеграции в уже существующую информационную инфраструктуру.

Какие методы интеграции возможны вообще? В качестве примера, приведем варианты, предлагаемые  компанией Эбско. Мы видим множество вариантов.

Какие же методы интеграции предлагают российские ЭБС?  Их, к сожалению, существенно меньше. Только «Книгофонд» и «БиблиоТех» предлагают  закрытый API к своим фондам и список изданий в формате MARC21, содержащихся в электронно-библиотечной системе. Совсем недавно возможность выгрузки записей в формате РусМарк появилась и в «Университетской библиотеке онлайн». Это хорошо, но явно недостаточно. В силу быстрого роста фондов, а рост у всех ЭБС значительный, список изданий моментально устаревает, а закрытый API требует  времени и денег для его внедрения в вузовскую инфраструктуру. Большинство ЭБС не предоставляют и этого, хотя важность задач понимают все их представители.

Самое простое решение этой проблемы – это предоставление издателями (агрегаторами) списка своих изданий по протоколу OAI-PMH.  В настоящее время уже разработано достаточное количество свободно распространяемого программного обеспечения (ПО) для организации OAI провайдера (сервера, который отдает всем желающим библиографические описания в формате DublinCore по протоколу OAI-PMH). Например, REPOX, хорошо зарекомендовавший себя в работе  Европейской библиотеки, есть и другие.

Для сбора данных по OAI известно свободно распространяемое ПО, например, VuFind, разработанное в Университете Виланова (США, Пенсильвания). В библиотеке Российского государственного гуманитарного университета уже есть успешный опыт установки и использования этого ПО для интеграции всех подписываемых зарубежных ресурсов и своего электронного каталога в единую поисковую систему. В такой системе каждый вуз сможет самостоятельно определять из каких ЭБС нужно получать библиографические записи, собирать их при помощи своего OAI сборщика и загружать в свой каталог.

При рассмотрении проблемы интегрируемости,  необходимо решить какую модель создания ЭБС выберет вуз. Возможны следующие подходы:

– подписка (как описано выше, вуз подписывается на различные ресурсы и создает средство одновременного поиска по всем ресурсам).

– вуз создает у себя программно-аппаратный комплекс (платформу) для последующей загрузки в нее электронных книг.

У каждого подхода есть свои плюсы и минусы. В случае подписки у Вас нет организационных проблем (и весьма существенных) с установкой и поддержкой платформы. Но с другой стороны, у Вас нет уверенности в долговременном существовании ЭБС, к которой Вы подписались. Как известно, «все проходит», коммерческая компания может разориться, может изменить политику комплектования (как показывает опыт подписки онлайновых журналов, в год меняется до 10% состава коллекции) или ценовую политику, у вас может не быть в какой-то период денег на подписку. В случае подписки Вы потеряете доступ. В случае хранения книг на своей платформе, Вы будете иметь их всегда. Примером такой платформы может быть решение компании «БиблиоТех». Некоторые электронно-библиотечные системы, например «Университетская библиотека онлайн», предлагают промежуточные решения, позволяющие создать свою коллекцию, но на платформе ЭБС. Это тоже возможный подход, но нужно учесть, что при этом интеграция с иными ЭБС становится невозможной.

Также нужно понять хотите ли Вы подписывать (покупать) уже готовую коллекцию или набирать издания в свою электронную библиотеку выборочно. С одной стороны готовая коллекция сильно экономит время библиотекаря. Как приятно, когда кто-то о тебе  уже позаботился. С другой стороны, для Вашего учебного заведения возможно будет лучше индивидуальный подход. Ряд ЭБС, например «ibooks», позволяют подбирать книги индивидуально. Следует отметить, что это очень трудоемкий путь. Как пишет Ирина Билан в своих комментариях к блогу Андрея Федорова про ЭБС : – «Кто должен считать, анализировать, имея квалификацию при этом? Вы представляете какой это объём работы? Кто из преподавателей бросит всё и будет заниматься анализом контента ЭБС по своей специальности? Ему надо писать УМК. И, зачастую, преподаватели не идут даже на менее затратные (с точки зрения времени) виды сотрудничества с библиотекой вуза, в котором трудятся. Или библиотекари? Но, опять же, вопрос наличия времени – такой объём работ будет реальным, только если подсчётами будет заниматься библиотекарь, который занимается только вопросами ЭБС и ничем другим. А таких ставок у нас нет. В зависимости от масштабов вуза это может быть и не один такой библиотекарь». Трудно с ней не согласиться. Хотя может быть получит распространение какой-нибудь промежуточный вариант?

Кроме оценки  возможности  интеграции различных ЭБС также нужно будет оценить и качество реализации в них отдельных функций. Можно выделить следующие показатели.

Типы предоставляемых изданий. Пока ЭБС предлагают нам только книги. В ЭБС  «Университетская книга» есть очень небольшое количество аудиокниг и мультимедийных материалов. Хотя отдельные ЭБС и пишут о возможности хранения в них не только книг, примеров реализации этих деклараций мне найти не удалось. Попробуем сравнить это с тем, что предлагают зарубежные издатели. Вышеупомянутая компания ЭБСКО, сейчас продвигает на рынок свой новый продукт – коллекцию книг NetLibrary.  Она содержит 220 000 электронных книг и 16 000 аудиокниг, при этом 6 000 из них могут быть прослушаны на IPOD. Понимая, что до абсолютных показателей нашим ЭБС далеко, хочу обратить внимание на процент аудиокниг.

Продвинутость поиска. Во всех ЭБС поиск устроен по-разному и возможности его очень различны. Количество поисковых полей разное (от двух полей в ЭБС «Лань» до девяти полей в IQlib), количество используемых Булевых операторов тоже разное (от одного «И» в «БиблиоТех» до трех  «И ИЛИ НЕТ» в ЭБС «book.ru»). Качество морфологического анализа тоже отличается в зависимости от используемой системы полнотекстового поиска. Большое значение имеет возможность усечения справа при задании поискового термина. В некоторых системах, особенно тех, кто использует ЯндехСервер, такая возможность отсутствует, а в некоторых, например Контекстум, работает также и усечение слева. Вопрос о необходимости продвинутого поиска в информационных системах постоянно обсуждается. С одной стороны, для продвинутых пользователей это очень удобно. Но с другой стороны, нынешнее «поколение гугл» привыкло искать в одной поисковой строке и не хочет осваивать «премудрости» расширенного поиска и языка запросов. Как показывают исследования, в 95 процентов случаев читатели  университетских библиотек используют для поиска в электронных ресурсах простой поиск. Поэтому прежде чем предъявлять требования по этому критерию, Вы должны решить на кого Вы ориентируетесь. Полнотекстовый поиск, как правило, есть во всех ЭБС и работает примерно одинаково (с точностью до морфологии), но в некоторых, например «IPRbooks», предусмотрена возможность поиска не во всей ЭБС, а только в той книге, которая загружена в в просмотрщик полного текста и реализуемая средствами просмотрщика. Это, конечно, не так удобно.

Используемые рубрикаторы. Обычно в каждой ВУЗовской библиотеке есть система классификации. Чаще всего это ББК или УДК.  В большинстве ЭБС используется своя собственная система классификации и поэтому проблема совместимости с системой классификации ВУЗа становится особенно сложной. Исключением являются «IQlib», использующая ББК и УДК и «Контекстум», использующий УДК. Для меня непонятен такой подход ЭБС, ведь практически все учебники, попадающие в ЭБС, имеют индекс ББК, пусть краткий, для массовых библиотек, но индекс. Если в ЭБС делается библиографическое описание книги, то почему бы туда не вставить этот индекс. Он позволит автоматически строить иерахию тем в коллекции. Надеюсь, что создатели ЭБС тоже прочитают этот текст (как показал анализ форумов про ЭБС, наибольшее количество комментариев там оставляют не библиотекари, а создатели ЭБС) и возьмут этот совет в работу.

Визуализация результатов поиска. При оценке методов вывода результатов следует обратить внимание на два момента: наличие сниппетов и возможность искать в найденном. Сниппеты (цитаты, содержащие поисковый термин) могут выводиться по разному (сниппетов нет вообще, выдается только первый сниппет, последовательно выдаются все сниппеты). Для оценки правильности работы системы и верности составления запроса сниппеты просто необходимы. Для обеспечения возможности уточнения поискового запроса чаще всего используется кластеризация (разбиение результатов на классы) выдачи, практически нигде не реализованная в российских ЭБС. В процессе поиска должно проходить взаимодействие пользователя и системы. Получив много шума в ответ на первый вариант запроса, пользователь должен получить от системы общую картину результатов, чтобы понять в каком направлении он может уточнять запрос. Для этого система должна разбить список полученных документов на классы по различным признакам (год издания, издатель, тема, и т.п) с указанием найденных в каждом классе результатов. Такой фасетный поиск (faset search) давно уже используется во многих зарубежных поисковых системах, например в упомянутой выше VuFind или Solr или на платформах некоторых издателей, например http://scirus.com и др.

Читатели, давно занимающиеся информационными системами, помнят, что этот термин  в нашей стране был известен очень давно, но почему-то в последние годы практически не использовался.

Международный консорциум EIFL организовал продвижение свободного программного обеспечения с открытым кодом для организации фасетного поиска (Blacklight, VuFind and Apache Solr). Для этого был запущен проект Faset search, в рамках которого проводились международные онлайновые семинары. В некоторых автор участвовал, и может засвидетельствовать их полезность для освоения этих продуктов. Хотя опять-таки эта информация нужна больше для создателей ЭБС.

Можно еще сформулировать множество критериев оценки. Например, качество библиографического описания электронных изданий. Хотя по моим наблюдениям, оно во всех ЭБС не очень хорошее и выбирать тут особенно не приходится.  Наличие постоянного адреса (URL) документа для ссылки на него тоже очень важно для интеграции ЭБС. Большинство ЭБС всем документам присваивают постоянный адрес, на который можно сделать ссылку в статье и быть уверенным, что она не поменяется, по крайней мере, пока существует эта ЭБС.

Можно сравнить методы вывода полного текста. Насколько для Ваших читателей удобно работать во встроенном флэш плеере или для Вас предпочтительнее отдельно приобретаемый просмотрщик полных текстов типа Vivaldi, который с одной стороны требует дополнительных затрат, но с другой стороны, обеспечивает дополнительную функциональность.

Большое значение имеют права по копированию, которые по-разному предоставляют нам ЭБС. Западные издатели тоже по-разному решают проблему копирования. Так например, Ebrary показывает книги постранично, в виде картинки, в специальном просмотрщике, а Эльзевир публикует свои книги в текстовом виде в формате PDF и никак технически не ограничивает возможность копирования. Эльзевиру, конечно, проще – на него не распространяется 4 часть ГК РФ, да и он, вообще, хозяин своих книг. Российским ЭБС сложнее, за ними законодательно закрепили обязанность исключить возможность копирования. Но не запретили цитирование, а его все понимают по-разному. Некоторые вообще не разрешают ничего копировать даже для цитирования, в некоторых мы можем отобрать до 10% страниц из книги, в некоторых до 1000 знаков, как разрешают другие ЭБС. Поскольку при составлении научной работы переписывать ручкой с экрана не самое приятное занятие, обращайте внимание при выборе ЭБС и на эту деталь.

Для получения общей статистики библиотеки  ВУЗа библиотекарю приходится  сводить воедино статистику использования от каждого подписываемого ресурса. Удобнее всего, если они будут в одинаковом формате. Ряд ЭБС  выдает некоторую статистику, но у каждой свой набор таблиц и для сведения их в единую форму библиотекарю приходится затратить много ручного труда. Опять обращаясь к зарубежному опыту, видим, что уже давно существует стандарт предоставления библиотечной статистики COUNTER, соблюдаемый многими зарубежными издателями. К сожалению, изо всех российских издательств только компания ИВИС (может потому что она представляет Ист-Вью?) следует этому стандарту. Поэтому одним из критериев оценки ЭБС должна стать оценка удобства их статистки.

Список критериев этим не исчерпывается и я уверен, что у каждого ВУЗа он будет свой со своими весами. Поэтому я не собираюсь  советовать какую-то конкретную систему, а хочу лишь обратить внимание  на важные моменты при выборе ЭБС.


Комментарии

Irina

Михаил, спасибо за обзор.
Полностью поддерживаю Ваши рекомендации в отношении систем классификации.
По-поводу статистики: а почему бы агрегаторам не обратиться к отечественным ГОСТ 7.20-2000 и форме 6-НК?
И – вопрос по Вашим сравнениям с зарубежными базами. Не рано ли нам сравнивать ЭБС с ними? Насколько это корректно, учитывая разницу в возрасте развития рынков?

Михаил Шварцман

По поводу статистики: ГОСТ 7.20-2000 и форма 6-НК рассчитаны только на библиотеки, предоставляющие свою отчетность вышестоящим инстанциям, а статистика, которую библиотеки хотят получать от агрегаторов должна помочь оценить правильность выбора каждого ресурса и успешность его продвижения. Поэтому она должна быть более подробной, чем требуется по ГОСТУ. Если наши агрегаторы будут выдавать нам статистику по стандарту COUNTER у нас не будет никаких проблем с заполнением формы 6-НК.
По поводу сравнения с зарубежными базами: а с чем еще сравнивать, с 1913 годом? Я уверен, что нужно равняться на лучших. Тем более, что в нашей сфере все так быстро развивается, что разница в возрасте большого значения уже не имеет.

Алексей Лавринович

Уважаемый Михаил, вы очень коротко сообщили об интеграции в “информационную среду вуза” – речь идет о софте или о контенте. или о том и другом одновременно?
Возможна ли, планируется или где-то уже есть интеграция с отечественными АБИС?
Мне задали еще такие вопросы, но моих знаний недостаточно:
– какие-нибудь аналоги протокола OAI-PMH поддерживает Web- ИРБИС? Он вроде поддерживает z39.50, но его нет в DSpace.
– не получается получить метаданные в расширенном Дублинском ядре. А в простом их описание не достаточное, чтобы отделить одно поле от другого.
– какие существуют решения по интеграции DSpace (или > Eprints) и ИРБИС?
Комменарии: какую интеграцию здесь имели в виду и с чем именно? Только при поиске или не только?
Вряд ли с ИРБИС 64 Полнотекстовые БД – ведь он отчасти “конкурент”? Значит, так сказать, с “простым” ИРБИСом, “библиографическим”? Единственное, что мне приходит в голову – упомянутое выше Dublin Core http://irbis.gpntb.ru/read.php?53,59260,62405#msg-62405
О поиске одновременно в ЭК и ПБД:
http://irbis.gpntb.ru/read.php?21,67637,71215#msg-71215
Но вот одновременно в ЭК и ЭБС? Вообще ведь пока не вполне ясно, что значит “ЭБС”…

Михаил Шварцман

Вопросов много и большинство из них не ко мне, давайте по порядку.
1. В данном контексте под интеграцией я понимаю одновременный поиск в различных базах. Это может быть распределенный поиск или поиск в предварительно собранных метаданных (или комбинированное решение). Основная задача в том, чтобы читателю не иметь дело с многочисленными поисковыми интерфейсами.
2. Пример подобной интеграции (ЭК и ЭБС) можно помотреть на сайте РГБ http://www.rsl.ru/ru , где проводиться распределенный поиск в электронном каталоге РГБ, ЭБС “Книгофонд”, БД “ЛитРес” и БД “EBSCO Discovery Service “. Также примером такого приложения может быть созданный в Сибирском федеральном университете механизм федеративного поиска. На странице http://libsearch.sfu-kras.ru/ размещена форма поиска, и список ресурсов, к которым университет имеет доступ. Для каждого ресурса заранее был изучен Web интерфейс его поисковой страницы и на PHP написана программа, автоматически заполняющая необходимые поля в поисковой форме и разбирающая ответ. Из российских ресурсов запросы от СФУ отправляются кроме своего ЭК в:
Электронная библиотека Издательского Дома “Гребенников”
Электронная библиотека диссертаций РГБ
Электронно-библиотечная система Издательства “Лань”
(более подробно об этом примере можно прочитать в майском номере журнала “Университетская книга” за 2012 год или http://www.aselibrary.ru/blogs/archives/960/)
3. Насколько я знаю, пока Web- ИРБИС не поддерживает OAI-PMH, но в этом направлении работы ведутся. Точный ответ на это могут дать, наверное в ГПНТБ.
4. DSPACE изначально не поддерживает z39.50, но в рамках проекта “Электронная Сибирь” Олег Жижимов с коллегами обеспечил поддержку z39.50 в DSPACE. За деталями к нему.
5. Вопрос “не получается получить метаданные в расширенном Дублинском ядре” не понятен. Не получается какими средствами?
6. Про интеграцию DSpace (или Eprints) и ИРБИС лучше спрашивать у разработчиков Ирбис, но мне кажется, что назначение этих систем настолько разное, что интеграция целесообразна только для одновременного поиска в них.

Алексей Лавринович

Разумеется, 6-НК и прочее – для министерства и другого нашего начальства, а для агрегаторов, вообще зарубежных фирм – совсем другое.

Алексей Лавринович

Михаил, большое спасибо…жаль, что в свое время не взяли меня когда-то к себе на работу (наполовину шутка), когда Вислый хотел мне помочь как очень давний знакомый и коллега (когда мы с ним были формально в одном звании)… или это был Зверев?
5-й вопрос я тоже не понял и посоветовал его автору обращаться к Вам непосредственно.


Оставить комментарий

Скрыто от всех