Исследование опыта построения современных электронных библиотек



ЭЛЕКТРОННАЯ БИБЛИОТЕКА СМИ PUBLIC.RU

 

 

Организационные вопросы:

1. Как возник замысел создания Вашей библиотеки?
Появление Public.Ru – это ответ на бурное развитие российского медийного рынка. У проекта была цель – избавить пользователей от необходимости искать информацию в тысяче разных источников. Поиск необходимых материалов был реализован не за счет традиционного для реальной библиотеки каталога, а по ключевым словам.
В 2000 году независимая группа разработчиков нашла частных инвесторов, разработала и запустила проект электронной он-лайн библиотеки СМИ. Кстати, сайт www.public.ru был открыт 1 апреля. Тогда первые пользователи получили доступ к 5 миллионам полнотекстовых электронных статей из 750 газет и журналов из всех регионов России.

2. Пользовались ли методическими рекомендациями при создании ЭБ. Если да, то какими?
На момент запуска проекта разработка ЭБ для России была делом относительно новым. В основном изучался опыт зарубежных библиотек и американских университетов, а также информационно-поисковые технологии (опять-таки зарубежные), которые к тому времени вышли на российский рынок. Выбиралась оптимальная с точки зрения релевантности поиска и устойчивости к нагрузкам поисковая платформа.

3. Какие организации участвуют в создании Вашей библиотеки? Как происходил отбор организаций - участников проекта?
У проекта «Электронная библиотека СМИ Public.Ru» единственный владелец – ЗАО «Публичная Библиотека».

4. Кто управляет библиотекой, принимает стратегически важные решения? - директор организации-учредителя, директор библиотеки, коллегиальный орган управления?
Генеральное руководство за мной. Отдельные руководители есть у таких стратегических направлений развития проекта как работа по формированию архива (Служба формирования фондов), новые программные разработки и техническая поддержка проекта (Техническая дирекция), коммерческая деятельность (Коммерческий блок).

5. Каким образом происходит подбор и обучение персонала?
Подбором и обучением персонала занимаются руководители направлений. Понятно, что каждое из них требует своих знаний и компетенций сотрудников. Размещаем вакансии на профильных порталах, например на площадке Headhunter и др.. Требуются программисты, специалисты по продажам, маркетологи, люди в производственный сегмент - сканировщики, графические редактора.

6. Из каких источников происходит комплектование фондов?
Наши фонды должны отражать актуальную картину русскоязычного медиапространства. Представлены все значимые общественно-политические, деловые и специализированные издания. Загружаются издания из всех регионов России: газеты областного (республиканского, краевого) уровня; общегородские газеты; местные вкладки центральных изданий; местные общеэкономические и деловые издания; пресса, отражающая экономическую, социокультурную, конфессиональную или иную специфику региона.
В интересах профессиональных пользователей стараемся соблюсти баланс, с одной стороны, предоставить им как можно более широкий охват СМИ, с другой – свести к минимуму количество источников, дублирующих информацию других изданий, так называемых перепечаток.
При включении новых источников в фонды учитываются множество факторов: тематика издания, его целевая аудитория, ареал распространения и т.п.
Мы изучаем рынок СМИ, который динамичен, регулярно меняется. Во время кризиса некоторые источники, которые раньше были бумажными, перешли в Интернет. Произошла трансформация подачи материала, при этом не изменился поставщик. Некоторые издания перестали выходить. В противовес им растем поток новых - узкопрофессиональных СМИ, СМИ, связанных с корпорациями, с определенными тематиками. Открывается много локальных изданий, финансируемых за счет различных местных организаций, органов власти.
Основная работа по ведению архива сосредоточена в Службе формирования фондов и Технической дирекции. За ними и ведение всего документооборота с поставщиками информации в фонды, и оцифровка печатных СМИ, и круглосуточная техподдержка ресурса, и разработка новых сервисов.

7. Как организован доступ пользователей к фондам электронной библиотеки – по сети Интернет со свободным или ограниченным доступом, только в помещениях вашей библиотеки, в нескольких специально организованных читальных залах?
Через Интернет.

8. Доступ к фондам для читателей осуществляется на платной или бесплатной основе? Если на платной, то существуют ли льготные условия и для кого?
Public.Ru – коммерческий проект. Доступ к фондам электронной библиотеки организован на платной основе. Разработана гибкая тарифная линейка. Основные наши клиенты: PR-подразделения и информационно-аналитические службы коммерческих структур, министерств и ведомств.
В последние годы появляется все больше подписчиков среди вузовских и публичных библиотек – для них предусмотрены особые условия доступа и действует система скидок.

9. Какие дополнительные сервисы предоставлены пользователям?
Главный наш сервис – сквозной поиск с использованием ключевых слов по обширному архиву. Однако в проекте регулярно разрабатываются, тестируются и внедряются новые информационные сервисы в области статистической обработки и систематизации результатов поиска. Сейчас у пользователей уже есть возможность формировать собственные персональные коллекции статей, изданий или авторов; получать автоматическое уведомление о появлении новых статей на e-mail, проводить статистические измерения упоминаемости темы в СМИ и анализировать результаты замеров на графиках и диаграммах.
По запросам клиентов мы подключаем к фондам новые издания. Конечно, если источники из такой заявки не противоречат политике формирования фондов Public.Ru.
На главной странице нашего сайта публикуется лента новостей «Темы дня. Новости первых полос» - ежедневно аналитики формируют дайджест с главными темами дня, которые нашли свое отражение СМИ. Количество подписчиков одноименной информационной рассылки составляет сегодня уже порядка 35 000 человек.

10. Проводите ли вы мероприятия по привлечению новых пользователей, по формированию собственного положительного имиджа?
Как уже отмечалось, Public.Ru – проект, ориентированный прежде всего на профессиональных пользователей. На первом плане у нас участие в профессиональных ассоциациях, выступления на отраслевых конференциях, разработка совместных медийных проектов с журналистами и редакциями СМИ.
Совместно с преподавателями вузов мы регулярно проводим обучающие семинары для студентов старших курсов и слушателей программ МВА в области коммуникационного менеджмента.

11. С какими сложностями вы столкнулись при формировании электронной библиотеки, как считаете, почему?
Главная сложность – отсутствие единого понимания и согласованной позиции в области авторского права у издателей периодической печатной продукции, а теперь и у владельцев тематических сайтов, чей контент мы тоже начали включать в свои фонды. Даже незначительные изменения правил в этой области заставляют нас серьезно пересматривать модель взаимоотношений с поставщиками информации.

12. Как планируете развивать библиотеку в ближайшее время?
Для любой электронной библиотеки всегда актуально наращивание объема фондов, для нас важно еще и расширение географии источников. Но главное чего хотелось бы – провести модернизацию поисковой системы библиотеки в сторону дальнейшей автоматизации анализа текстов. Хотим дать пользователям возможность больше времени уделять анализу уже собранных и структурированных для них данных.

Юридические вопросы:

13. Если ваша электронная библиотека зарегистрирована как юридическое лицо, то в какой форме собственности?
«Публичная Библиотека» - Закрытое акционерное общество.

14. Зарегистрирована ли ваша библиотека как средство массовой информации?
Да, зарегистрирована – Свидетельство о регистрации СМИ от 09.11.2010 г.

15. Зарегистрирована ли ваша библиотека как база данных?
Да – Свидетельство о регистрации базы данных от 23.11.2010 г.
Тут мы пошли навстречу вузам. Для них наличие таких свидетельств важно с точки зрения соответствия электронной библиотеки требованиям государственных образовательных стандартов.

16. Есть ли в вашей библиотеке произведения, охраняемые авторским правом?
Да, есть.

17. Заключаете ли вы письменные договора с авторами или правообладателями произведений, размещаемых в вашей библиотеке?
Обязательно. Формирование фондов происходит на условиях прямых договоров с издательствами, редакциями и поставщиками информации из регионов.

Технические вопросы:

18. На каком программном обеспечении построена ваша электронная библиотека?
Система хранения архива, система управления и биллинга потроены на платформе Microsoft. Базовый поиск в системе реализован на технологиях OpenText; расширенные возможности поиска и анализа – собственная разработка Public.Ru

19. Как происходила выработка спецификаций и технических требований к программному обеспечению?
В процессе переговоров всех заинтересованных в модернизации подразделений с техническими службами. Порой дискуссии бывают бурными.

20. Какое оборудование и технические средства задействованы в обеспечении функциональности вашей электронной библиотеки?
Серверная фабрика на базе современных четырехпроцессорных серверов Dell, система хранения EMC, сетевое оборудование Cisco, и, конечно, сканеры.

21. Какие технические требования к оборудованию предъявлялись?
Быстродействие, отказоустойчивость, компактность размещения, качественная и своевременная поддержка производителем.

22. Долго ли проходил процесс обучения работе с программным обеспечением сотрудников библиотеки?
Всегда проводим обучение сотрудников при появлении новых сервисов. Им в дальнейшем предстоит уже обучать и консультировать пользователей. Но, как правило, в течение месяца вопросы от сотрудников продолжают еще поступать.

23. Планируете ли развитие технической базы?
Да, планируем. Растут объемы архивов, новые сервисы также требуют новых мощностей.

24. Какой формат файлов используется в вашей библиотеки и почему?
Для хранения документов мы используем XML, при показе документов клиенту используются форматы HTML, RTF, XML.

25.  Какова технология обработки новых поступлений в библиотеку?
Материалы поступают в различных форматах. Большинство автоматически конвертируются в единый текстовый формат хранения. Материалы, поступающие на бумажном носителе или PDF, обрабатываются методом распознавания текста (OCR), после чего автоматически конвертируются в формат хранения.

26. Есть ли у Вас полнотекстовый поиск? Если есть, то на базе какого программного обеспечения он реализован?
Да, реализован на базе Open Text Search Server. Реализован контекстный и атрибутивный поиск. Поддерживается морфология. Есть расширенный язык запросов. Существует возможность сортировки информационного массива (результатов поиска) по алфавиту, по автору, по географии, по дате и другим параметрам.

27. Как Вы делали выбор формата описания?
Исходя из коммерческих требований к продукту. Мы используем свой собственный формат описания, позволяющий нам гибко подстраиваться под нужды клиентов.

28. Как Вы сделали выбор системы классификации?
Классификация изданий для нас всегда обусловлена ситуацией на медиарынке и запросами пользователей. Появляются, например, новые типы медиа (Интернет-СМИ) и мы меняем нашу систему классификации.

29. Какие были трудности в первый момент запуска технологического процесса?
В момент запуска сложности были скорее не технологического, а организационного характера. Важно было, в первую очередь, зафиксировать этапы обработки и загрузки текстов на хранения, выработать инструкции и форматы передачи данных между подразделениями, отладить механизмы реагирования на сбои. Сейчас все эти процессы уже идут непрерывно.

30. Какова технология долговременного (вечного) хранения информации?
Наилучшими по соотношению скорость доступа / цена единицы объема / надежность является дисковый массив. С обязательным резервным копированием на ленту.

31. Возможна ли интеграция вашей библиотеки с другими, если да, то по каким протоколам может проходить этот процесс (OAI-PMH, Z39.50, другое)?
Все зависит от конкретной задачи. Организовать поддержку того или иного протокола можно всегда. При интеграции необходимо учитывать много аспектов и нюансов, а выбор протокола основывается на возможности и пожеланиях всех участников процесса интеграции.

Вопросы финансового характера:

32. За чей счет осуществляется работа электронной библиотеки?
Мы коммерческая компания, сами себя финансируем. Предоставляем платный доступ к электронной библиотеке СМИ Public.Ru. Востребованы на рынке и наши информационные отчеты. По итогам мониторинга СМИ и медиаисследований их готовят аналитики компании.

33. За чей счет происходило приобретение компьютеров и программного обеспечения, инсталляция и настройка программного обеспечения?
Все траты на модернизацию и техническое оснащение – это собственные средства ЗАО «Публичная библиотека».

34. Привлекаются ли спонсорские финансовые средства? Если да, то как происходит поиск спонсоров?
Нет, не привлекаются.