Создание цифровых коллекций редких книг и рукописей из сибирских хранилищ
В докладе описываются различные варианты создания цифровых коллекций старопечатных и рукописных книг из сибирских хранилищ для предоставления их широкому кругу исследователей и учебных целей. При создании электронных версий старинных источников, помимо возможности просто "прочитать" текст, была поставлена задача адекватного отображения первоисточника при его переводе в электронную форму. Дополнительно в электронную версию включаются описания, указатели, исторический материал.
К июлю 2001 года созданы электронные версии " 300 единиц хранения общим объемом более 50 тыс. страниц. Помимо "традиционных" графических форматов начато изучение возможностей новых форматов.Электронные версии старопечатных и рукописных книг создаются для предоставления их широкому кругу исследователей и учебных целей.
Основное сибирское хранилище раритетов - Фонд редких книг и рукописей в Государственной публичной научно-технической библиотеке Сибирского отделения Российской академии наук г. Новосибирска. Фонд содержит разнообразные собрания русских и западноевропейских книг XIV-XIX вв. В их числе - знаменитая коллекция древнерусских рукописных и старопечатных книг академика М.Н. Тихомирова, завещанная им в 1965 г. сибирской академической библиотеке. Особый интерес представляют древнерусские книги, поступившие в библиотеку в результате 35-летних экспедиционных работ в среде сибирских старообрядцев. Эти книги образовали целый ряд территориальных коллекций, запечатлевших бытование книг и уровень духовной культуры русских людей, осваивавших бескрайние просторы Сибири. Много интересных экземпляров редких и рукописных книг имеется и в других сибирских городах.
При создании электронных версий старинных источников, помимо возможности просто "прочитать" текст, нами была поставлена задача адекватного отображения первоисточника при его переводе в электронную форму. Ведь важно отразить фактуру бумаги, особенности почерка и печати, цветовую гамму. Конечно, при современном уровне развития аппаратных и программных средств вычислительной техники, это возможно только в довольно ограниченной форме. Для исследовательских и, особенно, учебных целей крайне полезна возможность дополнительного включения в электронную версию описания, указателей, сопутствующего исторического материала.
Нам представляется, что единообразного проектного решения, подходящего для всех коллекций, скорее всего не существует. Мы индивидуально выбираем аппаратные средства и способы программной обработки первоначальных изображений для каждой из коллекций, которую начинаем переводить в электронную форму. При этом не ставится задача "резкого улучшения читаемости" исходного текста (и тем более распознавания), более важно адекватно отобразить первоисточник.
К июлю 2001 года созданы электронные версии следующих коллекций Фонда редкой книги ГПНТБ СО РАН: "Прижизненные издания А.С. Пушкина", "Книги пушкинской эпохи", "Вестник Европы: 1802 - 1820 гг." и 8 рукописных книг XVII - XIX вв. из собрания рукописных книг Тобольского филиала Государственного архива Тюменской области и Фонда редких книг и рукописей ГПНТБ СО РАН. Общий объем всех коллекций - более 50 тыс. страниц.
Начата работа над коллекцией древнерусских рукописных и старопечатных книг академика М.Н. Тихомирова.
По всем вопросам просьба обращаться по E-mail -
rbook@spsl.nsc.ru.В качестве первой в электронную форму переведена коллекция "Прижизненные издания А.С. Пушкина в Фонде редкой книги ГПНТБ СО РАН".
Технология обработки изображений и создания этой коллекции была описана ранее в [2].
Аналогичным образом обрабатывались коллекции "Книги пушкинской эпохи" и "Вестник Европы".
Создание электронных версий рукописных книг гораздо более сложно. Для адекватного отображения первоисточника, безусловно, требуется работать с цветными изображениями. Почти всегда нужны варианты просмотра с различными степенями увеличения, включая и довольно значительные. Соответственно, исходные файлы изображений должны быть весьма больших размеров. Конечный же результат практически всегда желательно разместить на одном компакт-диске.
Описание технологии см. в [3]. Эти версии созданы в рамках "традиционного" подхода - Jpeg + html + JavaScript.
Доступ ко всем вышеописанным коллекциям через Internet одинаков и не отличается от описанного ранее в [1] доступа к библиографическим базам ГПНТБ СО РАН.
Новые возможности, вероятно, появляются вместе с новыми графическими форматами, основанными на Wavelet технологиях. Возможно использование как коммерческих вариантов (ldf - LizardTech), так и бесплатных (в основной части) - Jpeg 2000. Мы реализуем свои пробные варианты для Jpeg 2000 с использованием программ на Java. Однако пока еще представляется, что и "обычный" Jpeg далеко еще не исчерпал своих возможностей и, по сумме всех факторов, предпочтительнее.
Затронем также такой актуальный вопрос, как создание "корпоративной" российской библиотечной программы по оцифровке и созданию различных цифровых коллекций - это могло бы кардинально увеличить наши общие возможности...
Выводы
Таким образом, в ГПНТБ СО РАН разработаны основы технологии подготовки и предоставления электронных версий старопечатных, рукописных и редких книг из сибирских хранилищ. Исследуются новые подходы в этой области.
Литература