Исследование опыта построения современных электронных библиотек

РУССКАЯ ВИРТУАЛЬНАЯ БИБЛИОТЕКА

 

Организационные вопросы: 

1. Как возник замысел создания Вашей библиотеки?
Замысел создания РВБ возник как ответ на несоответствие между представлением о гипертекстовой природе литературы, реализацией гипертекста в виде WWW и полным отсутствием (на тот момент) гипертекстового представления критических изданий «эталонных авторов». Сейчас, по прошествии 10 лет ситуация изменилась к лучшему, но до создания полномасштабного сетевого аналога печатной литературы еще далеко.

2. Какие организации участвуют в деятельности Вашей библиотеки? Как происходил отбор организаций - участников проекта?
Никакие организации в создании нашей библиотеки не участвуют: проект представляет собой свободную ассоциацию индивидуумов. У библиотеки существует ряд партнеров, перечень их есть на сайте: http://www.rvb.ru/links/friends.htm.

3. Кто управляет библиотекой, принимает стратегически важные решения? - директор организации-учредителя, директор библиотеки, коллегиальный орган управления?
Библиотекой управляет дирекция / редакция (Евгений Горный — директор, Игорь Пильщиков — научный редактор, Владимир Литвинов — технический редактор). Эта структура установилась еще на старте проекта.

4.  Из каких источников происходит комплектование фондов?
Сканируются печатные издания.

5. Как организован доступ пользователей к фондам электронной библиотеки – по сети Интернет со свободным или ограниченным доступом, только в помещениях вашей библиотеки, в нескольких специально организованных читальных залах?
По сети Интернет со свободным доступом.

6. Доступ к фондам для читателей осуществляется на платной или бесплатной основе? Если на платной, то существуют ли льготные условия и для кого?
Проект некоммерческий, направленность на извлечение прибыли в нем отсутствует. Подготовка, оцифровка и публикация текстов для их некоммерческого использования всеми желающими осуществляются в основном за счет грантов. Условия равные для всех пользователей, льготных программ нет.

7. Проводите ли вы мероприятия по привлечению новых пользователей, по формированию собственного положительного имиджа?
Своих рекламных кампаний мы не проводим, а достаточно высокий рейтинг цитируетмости РВБ поддерживается «сам собой»: мы делаем то, что нужно людям, и они на нас ссылаются.

8.  С какими сложностями вы столкнулись при формировании электронной библиотеки, как считаете, почему?
Главная сложность – прекращение финансирования, которое время от времени случается. Не всегда получается оперативно реагировать на замечания пользователей или изменение пользовательских потребностей: не хватает времени и рук. Но так или иначе, быстрее или медленнее, мы делаем всё, что хотим.

Юридические вопросы:

 

9. Если ваша электронная библиотека зарегистрирована как юридическое лицо, то в какой форме собственности?
Не зарегистрирована.

10. Зарегистрирована ли ваша библиотека как средство массовой информации?
Не зарегистрирована.

11. Зарегистрирована ли ваша библиотека как база данных?
Нет.

12. Есть ли в вашей библиотеки произведения, охраняемые авторским правом?
Есть.

13. Заключаете ли вы письменные договора с авторами или правообладателями произведений, размещаемых в вашей библиотеке?
В случае публикации произведений, не находящихся в общественном достоянии, получаем разрешение у авторов/издателей. Стандартной формы авторского договора мы не выработали.

Технические вопросы:

14. На каком программном обеспечении построена ваша электронная библиотека?
Серверное ПО: Web-сервер: Apache. SGML-процессор: CoST. CGI-программирование: Tcl, shell. Обработка SGML файлов: TEItools и специально для РВБ написанные программы. Пользовательские интерфейсы: HTML-формы и CGI-программирование. Конвертер из RTF в XML: omlette, требуется Omnimark engine. Верстка в PDF: PDFLaTeX. Search engine: glimpse. Все компоненты бесплатны.

15. Как происходила выработка спецификаций и технических требований к программному обеспечению?
Это происходило более-менее интуитивно, в процессе дискуссий. Формальной документации по soft- и hardware у нас нет.

16. Какое оборудование и технические средства задействованы в обеспечении функциональности вашей электронной библиотеки?
Компьютеры, сканеры и стандартное ПО.

17.  Планируете ли развитие технической базы?
Хотелось бы, но возможностей к этому мы не видим. Основные нужды проекта удовлетворительно обслуживаются на уже имеющейся базе.

18. Какой формат файлов используется в вашей библиотеки и почему?
HTML+CSS, два этих формата обеспечивают создание гипертекста и адекватную презентацию печатных изданий.

19. Какова технология обработки новых поступлений в библиотеку?
1. Тексты сканируются, экспортируются в MS Word, производится корректорская читка текстов и сопроводительных материалов, далее в MS Word-97 (8) производится перевод в формат HTML (в предыдущей версии, 95 (7) теги не закрывались, в последующей версии текст конвертируется в MS XML, в который вводится бездна презентационной информации, но логическая информация отсутствует, даже стили никак не вводятся).
2. Вносится дополнительная разметка
3. Текст чистится специальным шаблоном, удаляющим всю информацию о выравнивании, шрифтах, сдвигах и т.д. Что-то можно оставить, дело вкуса. Шаблон имеется, доступен.
4. Большой текст при помощи Xmarkup'а (http://www.rvb.ru/soft/xmarkup/xmarkup_171.htm) режется на малые.
5. После этого при помощи Xmarkup'а и утилит для потоковой замены производится замена этой разметки на содержательную (абзац + знак табуляции —> <div class="page" id="pg###"> </div> и т.д.), как для текстов, так и для комментариев.
6. Название отдельного текста и его автор проставляются в титул (<title>), и наносится разметка для автоматической генерации ссылок на сегменты комментария все тем же Xmarkup'ом.
7. Для поэтических текстов вводится разметка стихотворного размера (пока вручную), его вариаций (если в разностопном ямбе встречаются четырех— и шестистопные строки, то шестистопники сдвигаются влево; и т.п.).
8. Повторяющимся элементам текста (стихотворным строкам, абзацам прозы и номерам страниц) приписываются уникальные идентификаторы для позиционирования ссылок.
9. При необходимости расширяется и исправляется стилевой лист.
10. Проверяется правильность ссылок и синтаксиса.
11. Текст помещается на сервер, рассылается анонс, на начальной странице сервера публикуется «новость».

20. Есть ли у Вас полнотекстовый поиск? Если есть, то на базе какого программного обеспечения он реализован?
Да, реализован на базе ПО Яндекс. Сегодня он уже требует серьезной доработки.

21. Какие были трудности в первый момент запуска технологического процесса?
Трудности были в неотработанности самого процесса оцифровки и представления печатного материала: что и как представлять, что должно воспроизводиться обязательно, а что — факультативно, каковы приемлемые аналоги не воспроизводимым в электронной среде элементам печатного издания. Далее, чтобы процесс шел беспрерывно, он должен быть разбит на операции, последовательность которых зафиксирована, и эти операции распределены между сотрудниками, так что обрабатываемые книги идут как бы по конвейеру.

22. Какова технология долговременного (вечного) хранения информации?
Не разработана.

23. Возможна ли интеграция вашей библиотеки с другими, если да, то по каким протоколам может проходить этот процесс (OAI-PMH, Z39.50, другое)?
Возможна, но пока этот вопрос нами всерьез не рассматривался, и если он возникнет, то интеграция будет происходить в зависимости от форматов, используемых нашими потенциальными партнерами.

Вопросы финансового характера:

24. За чей счет осуществляется работа электронной библиотеки?
Мы ищем подходящие гранты, какие-то небольшие деньги приносит размещенная на сайте реклама.

25. За чей счет происходило приобретение компьютеров и программного обеспечения, инсталляция и настройка программного обеспечения?
Компьютеры и стандартное ПО приобретались за счет спонсирующих организаций (в основном — фондов-грантодателей).