НОВЫЕ ТЕХНОЛОГИИ В ИНФОРМАЦИОННОМ ОБЕСПЕЧЕНИИ НАУКИ

Создание цифровых коллекций редких книг и рукописей из сибирских хранилищ

С.Р. Баженов, В.Н. Алексеев, А.Ю. Бородихин, Е.И. Дергачева-Скоп, А.В. Шабанов
(Государственная публичная научно-техническая библиотека СО РАН)

В докладе описываются различные варианты создания цифровых коллекций старопечатных и рукописных книг из сибирских хранилищ для предоставления их широкому кругу исследователей и учебных целей. При создании электронных версий старинных источников, помимо возможности просто "прочитать" текст, была поставлена задача адекватного отображения первоисточника при его переводе в электронную форму. Дополнительно в электронную версию включаются описания, указатели, исторический материал. К июлю 2001 года созданы электронные версии " 300 единиц хранения общим объемом более 50 тыс. страниц. Помимо "традиционных" графических форматов начато изучение возможностей новых форматов.

Электронные версии старопечатных и рукописных книг создаются для предоставления их широкому кругу исследователей и учебных целей.

Основное сибирское хранилище раритетов - Фонд редких книг и рукописей в Государственной публичной научно-технической библиотеке Сибирского отделения Российской академии наук г. Новосибирска. Фонд содержит разнообразные собрания русских и западноевропейских книг XIV-XIX вв. В их числе - знаменитая коллекция древнерусских рукописных и старопечатных книг академика М.Н. Тихомирова, завещанная им в 1965 г. сибирской академической библиотеке. Особый интерес представляют древнерусские книги, поступившие в библиотеку в результате 35-летних экспедиционных работ в среде сибирских старообрядцев. Эти книги образовали целый ряд территориальных коллекций, запечатлевших бытование книг и уровень духовной культуры русских людей, осваивавших бескрайние просторы Сибири. Много интересных экземпляров редких и рукописных книг имеется и в других сибирских городах.

При создании электронных версий старинных источников, помимо возможности просто "прочитать" текст, нами была поставлена задача адекватного отображения первоисточника при его переводе в электронную форму. Ведь важно отразить фактуру бумаги, особенности почерка и печати, цветовую гамму. Конечно, при современном уровне развития аппаратных и программных средств вычислительной техники, это возможно только в довольно ограниченной форме. Для исследовательских и, особенно, учебных целей крайне полезна возможность дополнительного включения в электронную версию описания, указателей, сопутствующего исторического материала.

Нам представляется, что единообразного проектного решения, подходящего для всех коллекций, скорее всего не существует. Мы индивидуально выбираем аппаратные средства и способы программной обработки первоначальных изображений для каждой из коллекций, которую начинаем переводить в электронную форму. При этом не ставится задача "резкого улучшения читаемости" исходного текста (и тем более распознавания), более важно адекватно отобразить первоисточник.

К июлю 2001 года созданы электронные версии следующих коллекций Фонда редкой книги ГПНТБ СО РАН: "Прижизненные издания А.С. Пушкина", "Книги пушкинской эпохи", "Вестник Европы: 1802 - 1820 гг." и 8 рукописных книг XVII - XIX вв. из собрания рукописных книг Тобольского филиала Государственного архива Тюменской области и Фонда редких книг и рукописей ГПНТБ СО РАН. Общий объем всех коллекций - более 50 тыс. страниц.

Начата работа над коллекцией древнерусских рукописных и старопечатных книг академика М.Н. Тихомирова.

По всем вопросам просьба обращаться по E-mail - rbook@spsl.nsc.ru.

В качестве первой в электронную форму переведена коллекция "Прижизненные издания А.С. Пушкина в Фонде редкой книги ГПНТБ СО РАН".

Технология обработки изображений и создания этой коллекции была описана ранее в [2].

Аналогичным образом обрабатывались коллекции "Книги пушкинской эпохи" и "Вестник Европы".

Создание электронных версий рукописных книг гораздо более сложно. Для адекватного отображения первоисточника, безусловно, требуется работать с цветными изображениями. Почти всегда нужны варианты просмотра с различными степенями увеличения, включая и довольно значительные. Соответственно, исходные файлы изображений должны быть весьма больших размеров. Конечный же результат практически всегда желательно разместить на одном компакт-диске.

Описание технологии см. в [3]. Эти версии созданы в рамках "традиционного" подхода - Jpeg + html + JavaScript.

Доступ ко всем вышеописанным коллекциям через Internet одинаков и не отличается от описанного ранее в [1] доступа к библиографическим базам ГПНТБ СО РАН.

Новые возможности, вероятно, появляются вместе с новыми графическими форматами, основанными на Wavelet технологиях. Возможно использование как коммерческих вариантов (ldf - LizardTech), так и бесплатных (в основной части) - Jpeg 2000. Мы реализуем свои пробные варианты для Jpeg 2000 с использованием программ на Java. Однако пока еще представляется, что и "обычный" Jpeg далеко еще не исчерпал своих возможностей и, по сумме всех факторов, предпочтительнее.

Затронем также такой актуальный вопрос, как создание "корпоративной" российской библиотечной программы по оцифровке и созданию различных цифровых коллекций - это могло бы кардинально увеличить наши общие возможности...

Выводы

Таким образом, в ГПНТБ СО РАН разработаны основы технологии подготовки и предоставления электронных версий старопечатных, рукописных и редких книг из сибирских хранилищ. Исследуются новые подходы в этой области.

Литература

  1. Создание программного комплекса доступа из Интернет к базам данных на основе WWW-ISIS / Баженов С.Р., Мазов Н.А., Малицкий Н.А., Баженов И.С. // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: 5-я международная конференция "Крым-98": Материалы конференции. - М., 1998. - Т. 2. - С. 581-584.
  2. 2.Баженов С.Р., Шабанов А.В., Новоженин А.Ф. Создание полнотекстовых баз данных как основы электронной библиотеки ГПНТБ СО РАН // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: 6-я Междунар. конф. "Крым-99": Материалы конф. - Судак, 1999. - Т. 1. - С. 290 - 292.
  3. Баженов С.Р., Алексеев В.Н., Бородихин А.Ю., Дергачева-Скоп Е.И.,Шабанов А.В. Создание электронных версий старопечатных, рукописных и редких книг из сибирских хранилищ // 8-я Междунар. конф. "Крым-2001": Материалы конф. - Судак, 2001.