En


Михаил Шварцман
1 1592
Михаил Шварцман

Открытые API и создание сети разработчиков электронных библиотек

В последние несколько лет наблюдается постоянный рост количества разнообразных электронных коллекций, опубликованных в Интернете. Газеты, журналы, издатели, библиотеки, музеи, университеты и многие другие учреждения науки и культуры публикуют в Интернете свои документы. При этом, конечно же, неизбежно происходит пересечение интересов, и одни и те же документы становятся интересны и уместны в различных коллекциях. Для реализации одного из основных принципов автоматизации «однократного ввода и многократного и многоцелевого использования» применяется технология WEB сервисов, с помощью которой организация, создавшая ресурс может предоставить возможность всем желающим интегрировать его в собственные ресурсы.

К сожалению, в России в сфере создания электронных библиотек эта тенденция выражена очень слабо. В настоящей статье мы попробуем проанализировать, как развивается эта деятельность в электронных библиотеках других стран и что нужно сделать для того, чтобы и в России взаимосвязи электронных библиотек стали нормой, а не исключением.

Основной проблемой для создания WEB сервисов всегда является неясность потребности в них. С одной стороны, зачем создавать сервис и документировать API к нему, если еще непонятно найдутся ли разработчики, которые будут создавать свои приложения на его основе. Но с другой стороны, никто и не будет создавать приложения, если еще нет сервиса и API к нему. Поэтому создание сообщества разработчиков, развитие интереса к создаваемым сервисам и формирование спроса на них одна из основных задач во всех успешных ресурсах современности.

Все знают про работу, проводимую GOOGLE для привлечения разработчиков https://developers.google.com/ , но про аналогичную деятельность в сфере электронных библиотек известно меньше. Лидирующую позицию в этой области занимает OCLC. Часто задают вопрос, что является в этой ситуации первичным: создается сообщество потому что корпорация успешна или корпорация успешна, потому что создано сообщество разработчиков. Мне кажется, что все это очень взаимосвязано. В последние несколько лет OCLC перешла на новую ступень развития.  Они перешли на новую платформу OCLC WorldShare, предоставив пользователям ряд web сервисов и, что может быть самое интересное, открытых API и их подробное описание для всех желающих на специально созданном для этого сайте http://www.oclc.org/developer/. Были представлены API к следующим   сервисам:

1.OpenURL Gateway  сервис переадресации к полнотекстовым ресурсам. 2.QuestionPoint knowledge base API   поиск в базе данных выполненных справок
3.WorldCat Search  поиск   во всех записях WorldCat/
4.WorldCat Identities  поиск сведений о персоналиях (авторы, персонажи, корпорации, лошади, корабли и т.д.)  в WorldCat.
5.Worldcat Registry поиск в всемирном справочнике библиотек, архивов.  музеев
6.WMS Vendor Information Center API поиск информации о продавцах
7.xISBN (XISSN) поиск по ISBN (ISSN) в в WorldCat и выдача отдельных метаданных
и ряду других.

Большое внимание уделяется в OCLC продвижение новых возможностей. Так например, выделены сотрудники, ежедневно отвечающие за поддержку этих сервисов, и определены часы их работы по поддержке разработчиков. Регулярно проводятся семинары и вебинары. На международных конференциях, связанных с разработкой библиотечного программного обеспечения, при поддержке OCLC выделяются секции для обсуждения разработок приложений для работы с API OCLC. Посмотрим, каков же результат этой работы. В настоящее время на сайте разработчиков опубликованы описания 110 приложений для различных сервисов. Для того, чтобы все желающие могли убедиться, что ничего сложного в создании приложений нет, первые приложения были  сделаны сотрудниками OCLC и их исходные коды были выложены в открытый доступ,. Среди таких приложений наиболее интересным мне представляется xISSN History Visualization Tool  http://worldcat.org/xissn/titlehistory , который использует сервис поиска  метаданных по ISSN и строит схему слияний, разделений и переименований журнала.


Больше всего приложений (45) создано для использования WorldCat Search API. Среди них присутствуют приложения для различных платформ. Так например, сделано приложение для Facebook http://apps.facebook.com/worldcat/, которое позволяет проводить поиск в базах данных OCLC, не выходя из Facebook, и обещает учитывать интересы пользователя, занесенные в его профиль. Справедливости ради следует отметить, что мне не удалось понять, как они учитываются, а кириллица при поиске работает некорректно. Но дело не в этом, а в том, что нашлись разработчики, осознавшие необходимость использования библиографического поиска и формирования библиографического списка из найденной литературы в соответствии с различными стандартами (российского, конечно же, там нет).

Очень важной для пользователей оказывается задача определения ближайшего местоположения книги. Для поиска книг в российских библиотеках эту информацию можно получить на портале госуслуг http://www.gosuslugi.ru или в сводном каталоге Либнет http://www.nilc.ru/, однако результаты поиска можно посмотреть только на этих сайтах. Никаких открытых средств интеграции поиска во внешние системы не предусмотрено. Видимо поэтому никто и не разрабатывает приложений учитывающих эти данные. В OCLC пошли другим путем. Все их сервисы открыты для некоммерческого использования всеми желающими. Поэтому приложения, решающие задачу определения местоположения книги разрабатываются в большом количестве, различными программистами и с различным функционалом.    Для решения такой задачи нужно воспользоваться уже двумя сервисами: Worldcat Registry и WorldCat Search API. Различных приложений, решающих эту задачу, сделано немало. Мне более других понравилось приложение Pic2Shop. Это бесплатное приложение для Android или iPhone, которое превращает ваш телефон в сканер штрих-кода. Оно позволяет сравнить цены и проверить, есть ли в местной библиотеке книги, которые вас заинтересовали.

Для многих ученых очень важно знать является ли тот или иной журнал рецензируемым. Потому задача использования сервиса xISSN привлекала нескольких разаботчиков. В результате появилось несколько приложений  решающих одну задачу – простановку отметки о рецензируемости в списке журналов. Например сотрудники IDS Project разработали приложение, которое так и называется Peer Reviewer http://www.idsproject.org/Tools/PeerReviewer.aspx , которое добавляет такие отметки.

Библиографические данные нужны не только пользователям библиотек. При описании музейных объектов бывает  необходимо делать ссылки на книги, связанные с объектами или личности, имеющие отношение к этим объектам. Для того чтобы использовать огромный запас данных, уже имеющийся в OCLC, музей Powerhouse (Австралия) http://www.powerhousemuseum.com при описании личностей использует  сервис WorldCat Identities. На рисунке  мы видим, что при выборе фотографии Юрия Гагарина, нам выдается ряд сведений о фотографии, как объекте хранения, а за сведениями о Юрии Гагарине нас отсылают в OCLC.

Если мы последуем по этой ссылке, то получим довольно подробную информацию о нем.

Хочу отметить, что этот музей, не только сам использует сторонние Web сервисы, но и предоставляет свои http://api.powerhousemuseum.com .

В некоторых библиотеках одновременно  используются сервисы сразу нескольких ресурсов. Так, например, New York Times предоставляет API к своему набор сервисов  http://developer.nytimes.com/

и среди них есть возможность получение списка бестселлеров на текущий момент в различных категориях книг. Кстати, приложений с использованием этого API уже разработано довольно много.

В библиотеке  University of Puget Sound объеденили возможности этого API и сервисов OCLC. На сайте библиотеки можно выбрать категорию книг, в которой  ищется бестселлер, в полученном от NY Times списке выбрать интересующий Вас бестселлер и затем используя WorldCat Search API получить название библиотеки, в которой имеется это издание.

Интересные  приложения  можно обсуждать долго, однако нас интересует вопрос как мотивировать разработчиков в участии и создании различных приложений. Из опыта OCLC что это большое внимание со стороны сотрудников, хорошо документированные средства, постоянные мероприятия по обучению и реклама этой деятельности.

OCLC это некоммерческая организация,  посмотрим как обстоят дела у коммерчески успешных компаний в нашей сфере.
Если мы посмотрим как работает Эльзевир, создавая свое сообщество разработчиков http://www.applications.sciverse.com/action/gallery, то увидим, что в его подходе есть принципиальные отличия от OCLC. Приложения в основном нацелены на улучшение поисковых возможностей платформы Sciverse, на более удобную визуализацию полученных результатов, а не на предоставление внешним системам доступа к данным. Для мотивации разработчиков используется в основном конкурс разработчиков с хорошими денежными призами.
Так в последнем конкурсе http://appsforscience.com было  более 6 000 участников и призовая сумма составила 35000$. Различные мероприятия проводятся существенно реже чем в OCLC, но примерно один раз в месяц какое-то мероприятие в мире посвященное разработке приложений происходит. Разумеется ,у разработчиков есть свой сайт , на котором ведется обсуждение возникающих проблем. У компании EBSCO иной подход. Они разработали EBSCOhost Integration Toolkit http://support.epnet.com/eit/ , в который входит в том числе и web сервис, сделали к нему подробную документацию и пока никаких действий по привлечению посторонних разработчиков не предпринимают.

Если мы посмотрим на разработчиков программного обеспечения для электронных библиотек, то некоторые из них действуют также как и Эльзевир. Например, компания Exlibris также организовала сообщество разработчиков http://www.exlibrisgroup.org/display/CodeShare/Home , которое нацелено в основном на улучшение функционала продуктов компании. Но поскольку API к ряду своих продуктов компания опубликовала разрабатываются и различные интеграционные приложения. Например Combine Primo Central API Records with Solr Records http://www.exlibrisgroup.org/display/PrimoCC/Combine+Primo+Central+API+and+Solr+Records. Для мотивации разработчиков используются соревнования,

так же как и в Эльзевир. Правда проводятся они реже, участников бывает меньше  и призовой фонд существенно меньше – 12 000$ в 2010 году.

Если мы посмотрим на состояние дел в России,  то увидим, что поставщики информации практически не предоставляют API к своим ресурсам. Даже те из них. которые предоставляют свободный доступ к метаданным через web интерфейс не предоставляют открытого API. Хотя мне кажется, что потребность у российских пользователей уже есть и наверняка бы нашлись желающие воспользоваться такими API и написать свои приложения.  В отсутствие такой возможности приходится использовать довольно трудоемкий подход разбора HTML страниц в поисковом интерфейсе нужного ресурса. Примером такого приложения может быть созданный в Сибирском федеральном университете механизм федеративного поиска. На странице http://libsearch.sfu-kras.ru/  размещена  форма поиска, и список ресурсов, к которым университет имеет доступ. Для каждого ресурса заранее был изучен  Web интерфейс его поисковой страницы и на PHP написана программа, автоматически заполняющая необходимые поля в поисковой форме и разбирающая ответ. Из российских ресурсов запросы от СФУ отправляются в:

  • Электронная библиотека Издательского Дома “Гребенников”
  • Электронная библиотека диссертаций РГБ
  • Электронно-библиотечная система Издательства “Лань”

Запросы в РГБ могли бы и по протоколу Z39.50 направляться, а для остальных двух ресурсов, конечно, было бы удобнее иметь стандартный протокол обмена данными и не беспокоится о том, что при каждой смене интерфейса нужно исправлять программу.

Мне кажется, что если бы наши издатели взяли пример с Эльзевир, то и продажи бы у них были больше.
Что касается российских  разработчиков программного обеспечения для электронных библиотек,  то здесь тоже не видно сообществ разработчиков вокруг компаний производителей ПО. Мне удалось найти только  один пример такого сообщества.  Это форум разработчиков для ИРБИС http://irbis.gpntb.ru/list.php?24 . Участников  там немного, но они все таки есть и работа видимо идет.

В связи с вышеизложенным хочу предложить, чтобы Ассоциация электронных библиотек стала центром сбора информации о существующих средствах интеграции электронных ресурсов и приложений, разработанных пользователями этих ресурсов. Создателей же программного обеспечения и держателей онлайновых ресурсов еще раз прошу обратить внимание на то, что чем больше средств доступа будет к Вашим ресурсам, тем прибыльнее будет Ваш бизнес.


Комментарии

Арсен Боровинский

Я бы еще упомянул:

1) openlibrary.org, правда, на вскидку, пару учебников из своего университета по isbn в нем не нашлось.
openlibrary.org используется в модуле https://drupal.org/project/ISBN2node для сайтов на drupal, но у меня модуль не смог нормально извлечь данные по isbn.

2) google books тоже предоставляет API для поиска по различным параметрам. Правда, число бесплатных запросов в сутки ограничено. Увеличение квоты возможно за деньги.
Описание API: https://developers.google.com/books/docs/v1/using
Так же есть модуль для drupal: https://drupal.org/project/google_books

Что, неужели в 2013 году в России нет ни одной некоммерческой организации предоставляющей выгрузку информации по ISBN?


Оставить комментарий

Скрыто от всех