Новые технологии в информационном обеспечении науки

ЗАРУБЕЖНЫЕ И РОССИЙСКИЕ РЕСУРСЫ В СФЕРЕ НАУЧНОГО НАСЛЕДИЯ И ОСНОВНЫЕ ПРИНЦИПЫ СОЗДАНИЯ ЭЛЕКТРОННОЙ БИБЛИОТЕКИ “НАУЧНОЕ НАСЛЕДИЕ РОССИИ”

Антопольский А.Б.
(Некоммерческое партнерство
“Электронные библиотеки”, Москва)

Работы по созданию электронной библиотеки (ЭБ) “Научное наследие России”, которые ведутся в рамках одноименной целевой программы Президиума РАН, требуют определенного аналитического обеспечения, которое отчасти должен восполнить настоящий доклад. В данном докладе тем не менее не предполагается давать исчерпывающий анализ состояния информационных ресурсов в области научного наследия, тем более что в недавно вышедшей работе [1] приводится достаточно подробный анализ ситуации с электронными библиотеками как в мире, так и в России. Дадим лишь краткий очерк состояния проблемы.

Зарубежный опыт

Работы по созданию ЭБ ведутся весьма широко и в проектах разных масштабов. Известны большие международные проекты (Всемирная цифровая библиотека, Европейская цифровая библиотека, проект “Гуттенберг” и др.), множество национальных проектов (США, Франция, Германия, Япония, Великобритания, Испания и др.). Кроме того, в отдельных университетах и библиотеках ведется множество проектов по созданию цифровых коллекций, в том числе полностью или частично, отражающих тематику научного наследия. Приведем некоторые характерные примеры.

Тематические и персональные коллекции

Проект Архимед.

Проект осуществляется консорциумом в составе Института истории науки им. Макса Планка (Берлин), Гарвардского университета, Университета Миссури (Канзас-Сити) и проекта “Персей” Университета Тафта. Проект поддерживается Национальным научным фондом в рамках программы “Инициатива по электронным библиотекам” (DLI, Phase 2). Целью проекта является создание инструмента для интерактивного изучения истории механики, исследования развития ментальности в сфере механики. Одновременно проект создает образец открытой библиотеки по истории науки. Фонд библиотеки составляют многочисленные труды по механике на различных языках, в том числе на латинском и греческом, итальянском, включая инкунабулы. Библиотека снабжена специальным морфологическим анализатором для этих языков, современными и историческими словарями, другим справочным аппаратом (http: //archimedes.mpiwg-berlin.mpg.de/arch/archimedes.new.html)

Классическая наука он-лайн (Болонья)

Коллекция создана Международным центром истории университетов и науки при поддержке Итальянского национального научного совета в рамках проекта по культурному наследию. Коллекция основана на новой издательской серии научной классики, полные тексты которой будут доступны в режиме онлайн. Серия включает произведения, которые получили всемирное признание и охватывают историю Болонского университета за многие столетия.

Калифорнийский архив океанографических исследований

Коллекция создана совместной работой архива и библиотеки Океанографического института Скриппса, Суперкомпьютерного центра Сан-Диего и Исторического общества Сан-Диего (США). Она включает в себя различные текстовые, графические и аудиоресурсы, относящиеся к океанографическим исследованиям, проводящимся в Калифорнии. Коллекция содержит документы, данные и изображения по 822 экспедициям, организованным Океанографическим институтом Скриппса, начиная с 1903 г. Система позволяет свободное включение новых материалов. Ресурсы снабжены метаданными, позволяющими проводить разнообразные виды поиска.

Встреча цивилизаций

ECHO (European Cultural Heritage Online — Европейское культурное наследие Онлайн). Проект осуществляет Институт истории науки Макса Планка в Берлине, Германия, с участием других научных коллективов. Коллекция включает оцифрованные документы, посвященные развитию и взаимодействия западной и восточной цивилизаций начиная с шумерских клинописных табличек (3000 до нашей эры), оцифрованных в рамках проекта CDLI(см.), и вплоть до 20 века.

Цифровой Галилей

Данный проект включает несколько отдельных коллекций. Коллекция трудов Галилея создана Национальной центральной библиотекой Флоренции (Италия) и включает избранные труды в виде факсимильных изображений. Поиск доступен через базу данных на итальянском языке. Для просмотра изображений требуется веб-браузер, поддерживающий Java “Заметки о движении” Галилео Галилея.- объединенный проект Национальной центральной библиотекой Флоренции, Института и музея истории науки (Флоренция) и Иснститута истории науки Макса Планка (Берлин). Оцифрованный труд Галилея с двуязычным интерфейсом на английском и итальянском языках. Объединенный цифровой репозиторий трудов Галилея http: //moro.imss.fi.it:9000/struts-aig/primoIngresso.do создан Флорентийским институтом и музеем истории техники. Включает труды Галилея начиная с ранних публикаций датируемых 1540 г. и свыше 36 тыс. изображений, связанных с историей науки. Имеет двуязычный интерфейс на английском и итальянском языках. Harmonia Macrocosmica Андреаса Целлариуса (1661). Цифровое представление упомянуто астрономического атласа. Имеется возможность поиска и просмотра. Проект выполнен библиотекой университета Мариотта (ЮТА. США).

История медицины с 16 века

Проект выполнен Межуниверситетской медицинской библиотекой (Париж, Франция). Коллекция содержит около 2,5 тыс. произведений общим объемом 415 тыс. стр. Включает в себя наиболее значительные произведения по истории медицины и стоматологии начиная с 16-го века. Коллекция снабжена средствами навигации и поиска а также справочно-библиографическими указателями и комментаряими, подготовленными сотрудниками библиотеки Collection Medic@.

Мендель в вебе

Проект Роджера Блумберга, начатый в 1997 г., представлен по адресу: http://www.mendelweb.org. Образовательный ресурс, предназначенный для преподавателей и студентов, интересующихся историей науки, и в частности источниками классической генетики. Основан на классической труде Грегора Менделя 1965 г. “Опыты по гибридизации растений” и его пересмотренной англоязычной версии. Ресурс представляет собой источник литературы по истории генетики и представляет сервисы для совместной работы студентов и исследователей данной области.

Проект Ньютон

Проект осуществляется с 1998 г. Центром истории науки, техники и медицины Лондонского имперского колледжа совместно с Кембриджским университетом. Доступен по адресу: http://www.newtonproject.sussex.ac.uk/prism.php?id =. Цель проекта — сделать доступными в электронной форме рукописи и печатные изданий Ньютона, как в виде факсимильных изображений, так и в распознанном виде. Коллекция включает в себя разнообразные документы, относящиеся к изучению трудов Ньютона.

Архив А. Эйнштейна он-лайн

Адрес: http://www.alberteinstein.info. Объединенный проект Архива Альберта Эйнштейна, Еврейского университета в Иерусалиме, Еврейской национальной библиотеки и Калифорнийского института технологии в Пасадене. Коллекция включает в себя свыше 900 оцифрованных рукописей в виде изображений с высоким разрешением.

Труды знаменитых астрономов Болонской Обсерватории

Проект астрономического отдела исторического архива Болоньи и болонского университета. http://www.bo.astro.it/~biblio/sma/index.html. Цифровая коллекция трудов трех астрономов: Эустаччио Манфреди, Витторио Франческо Станкари и Эустаччио Дзанотти, относящихся к их деятельности в Болонской обсерватории. Коллекция включает в себя ссылки на другие оцифрованные исторические труды, имеющиеся в университетской библиотеке.

Проект Линней

Проект осуществляется на основе сотрудничества Международного центра изучения 18-го столетия Ферней-Вольтер и Международного общества изучения 18-го столетия университета Рутгера. Проект имеет целью сделать доступными в вебе письма Карла Линнея(1707-1778). Включает в себя шведские источники.

Цифровая библиотека Александра Гумбольдта

Проект Университета прикладной науки в Оффенбурге, Германия. Создан пилотный прототип мультимедийного онлайнового цифрового архива Александра Гумбольдта, который будет далее развиваться как распределенный цифровой архив с участием немецких и американских университетов.

Коллекция Аллена Ньюелла

Коллекция создана библиотека Университета Карнеги Меллона и представляет собой мультимедийный архив, отражающий важнейшие этапы научного пути известного ученого. Отдельные его труды представлены в виде факсимильных изображений. Ален Ньюелл (1927-1992) был пионером в области искусственного интеллекта и систем представления знаний.

Труды братьев Райт

Коллекция создана в рамках проекта “Память Америки” в Библиотеке Конгресса США в результате совместной работы департаментов рукописей и фотографий. По оцифровке различных материалов, относящихся к деятельности Уилбура и Орвилла Райт по созданию управляемого полета. Включает корреспонденцию, дневники, записные книжки, рисунки, чертежи, печатные материалы, а также коллекцию фотографических негативов на стеклянных пластинах.

Путешествия и открытия

Голубая книга по исследованию Арктики

Библиотека Университета Манитоба, Виннипег. Представляет собой Интернет-версию уникального указателя Эндрью Тейлора к материалам Британского Парламента 19-го века, относящимся к исследованиям Канадской Арктики.

История геологического изучения Канады

Коллекция создана в Университете Торонто и содержит отчеты экспедиций Дж. Тиррела по геологическому изучению Канады 1892-1894 гг.

Путешествия Френсиса Дрейка

Коллекция создана Отделом редких книг и специальных коллекций Библиотеки Конгресса. Коллекция включает собранные книжным антикваром Гансом Петером Краусом первичные и вторичные материалы, относящиеся к путешествиям Френсиса Дрейка по испанским владениям Америки. Тексты на английском, латинском, немецком, голландском, ительянском, испанском, французском языках. Коллекция включает 60 единиц -16 рукописей, 29 книг, 8 карт, а также 7 медалей и портретов.

Таким образом, очевидно, что значительная часть электронных коллекций, ориентированных на сохранение в электронной форме научного наследия, являются узко специализированными, создаются в основном в университетах, а также отдельными энтузиастами. Многие важные принципы создания специализированных электронных библиотек по научному и культурному наследию изложены в работе [2]. Практически все заметные проекты в данной области осуществляются на основе широкого международного сотрудничества.

С другой стороны, в большинстве развитых стран осуществляются национальные проекты по созданию электронных библиотек, предполагающих оцифровку большого количества материалов, относящихся к культурному наследию. Крупнейшим из них является проект “Память Америки”. Ведущими участниками национальных проектов по оцифровке культурного наследия, как правило, являются национальные библиотеки.

Российские электронные библиотеки
в сфере научного наследия

Проблема описания российских электронных библиотек по научному наследию является нетривиальной, поскольку сам термин “научное наследие” вряд ли может быть определен достаточно точно. К тому же можно предположить, что трактовка этого термина меняется для различных областей науки, особенно для гуманитарных, технических и естественных наук. Особый взгляд на эту проблему у историков, в том числе историков науки. Очевидно, имеет значение и “возраст” науки. В таких молодых отраслях, как, например, информатика, к научному наследию следует относить книги, написанные совсем недавно, например, 30 лет тому назад. В то время как для философии книги этого времени, бесспорно, являются современными.

Если же рассматривать задачу создания электронной библиотеки по научному наследию как задачу разрушения барьеров между академическим сообществом и широкой публикой (как это делают авторы работы [2]), то есть как одно из направлений популяризации науки, то проблема критериев комплектования такой библиотеки становится еще более размытой.

Очевидно, что многие оцифрованные книги, другие документы, относящиеся к научному наследию, входят в состав коллекций создаваемых в крупных библиотеках — РГБ. РНБ, ГПИБ и др., также в научных учреждениях, университетах и других учреждениях. Обзор этих коллекций также представлен в [1].

Такие документы можно обнаружить практически во всех сколько-нибудь заметных электронных библиотеках. Поскольку большинство российских электронных библиотек являются любительскими, то включение в них книг, относящихся к научному наследию, происходит случайно, на основе субъективных оценок составителей библиотеки.

Примеры включения классических научных трудов в массовые электронные библиотеки весьма многочисленны.

Возьмем, например, астрономию. Электронная библиотека ЧАРА города Чистополя (http://reestr.elibra.ru/lib.chistopol.ru//t_blank) содержит свыше 4 тыс. книг по науке, в том числе несколько десятков по астрономии, среди которых можно обнаружить избранные труды А. Козырева, бесспорно относящиеся к категории научного наследия.

Классические труды по астрономии можно обнаружить еще во многих любительских электронных библиотеках. А вообще электронных коллекций по астрономии великое множество, достаточно проанализировать Путеводитель астрономов по Интернет (http://astra.prao.psn.ru/SAM/WIN/astro.htm). Выявление в них материалов научного наследия — задача, требующая профессионального знания предмета.

Рассмотрим другой пример. Такой сюжет научного наследия, как история развития отечественной вычислительной техники и информатики, представлен в ряде ресурсов, образующих некоторое сообщество в Интернете.

Виртуальный компьютерный музей (http: //www.computer-museum.ru/index.php). Ресурс содержит ряд разделов, в том числе “Галерея славы”. Этот раздел музея содержит научные биографии выдающихся ученых и инженеров, которые внесли наиболее весомый вклад в создание и применение отечественных средств вычислительной техники. Статьи раздела посвящены основателям школ разработки и главным конструкторам универсальных вычислительных машин, универсальных и специализированных управляющих машин, специализированных вычислительных машин военного назначения. В разделе также представлены статьи об основателях отечественных школ программирования. Музей имеет и ряд других разделов: История отечественной вычислительной техники, История программного обеспечения, История компьютерных игр, История развития электросвязи, Книги и пресса, Документы.

Музей также содержит аннотированные ссылки на другие музеи по истории вычислительной техники в России, некоторые из них мы приведем здесь. Этот музей и связанные с ним электронные ресурсы могут служить хорошей иллюстрацией для оценки состояния и рассеяния документов по истории науки и техники.

Электронный архив академика Андрея Петровича Ершова — это проект Института систем информатики Сибирского отделения Российской академии наук, осуществляемый благодаря спонсорской помощи Microsoft Research и при технической поддержке компании xTech. Архив содержит уникальные документы, отражающие историю развития информатики в СССР, переписку академика Ершова и рукописи его работ. В архиве упоминается более 5 тысяч человек, оставивших свой след в истории развития информатики в нашей стране и за рубежом (http://ershov.iis.nsk.su/russian).

Значительное число сайтов посвящено различным аспектам Истории отечественной вычислительной техники. Они представлены на сайтах НИВЦ МГУ (http://www.parallel.ru//t_blank), МГТУ им. Баумана (http://museum.iu4.bmstu.ru/index.shtml/t_blank), многочисленных сайтах, поддерживаемых энтузиастами — частными лицами (Б.Н. Малиновским — http://sovietcomputing.com//t_blank, Эндрю Дэйви — http://www.taswegian.com/MOSCOW/soviet.html/t_blank, Сергея Фролова — http: //www.rk86.com/frolov/calcoll.htm, Сергея Тархова — http://www.bashedu.ru/konkurs/tarhov/russian/index_r.htm/t_blank и др.)

Значительное количество материалов по научному наследию представлено на сайтах образовательных учреждений. Рассмотрим, к примеру, систему ресурсов Московского государственного университета им М.В. Ломоносова.

Среди более 300 ресурсов (сайтов, тематических серверов и коллекций) этого комплекса мы находим несколько целиком относящихся к научному наследию. Это, прежде всего, электронный музей “История Императорского московского университета” (http://museum.guru.ru/), коллекция документов и публикаций по истории Московского университета (http://www.mmforce.net/msu/story/), сайт посвященный А.Н. Колмогорову (http: //www.kolmogorov.pms.ru/). Имеется также коллекция “классический университетский учебник”. Однако, кроме того, материалы по истории науки, персоналиям, публикации отдельных классических научных трудов мы находим также на различных тематических сайтах, сайтах факультетов и отдельных кафедр. Например, на Ботаническом сервере МГУ (http://herba.msu.ru) имеется раздел “классики науки”.

Даже беглый взгляд на проблему показывает очень большой объем и высокую степень рассеяния информации по научному наследию.

Следует также иметь в виду, что согласно замыслам создателей электронной библиотеки “Научное наследие РАН” [3] в эту библиотеку должны включаться не только полные тексты произведений известных русских ученых, но и энциклопедические сведения о них, библиография их трудов, портреты, фотографии, видео и кино-материалы и другие сопутствующие документы. В такой постановке число потенциальных источников рассматриваемой библиотеки еще более возрастает. Так, множество ресурсов содержит электронные энциклопедии, как универсальные, так и отраслевые, российские, советские и современные, официальные и личные. Среди них нужно отметить “Википедию” — один из наиболее популярных ресурсов, создаваемый, как известно, на общественных началах самым широким кругом заинтересованных лиц. Эта энциклопедия содержит громадное число статей, посвященных российской науке и российским ученым. Широко известен проект “Рубрикон”, содержащий оцифрованные версии ряда наиболее известных печатных энциклопедий

Можно указать и на многие другие разнородные ресурсы, содержащие материалы по истории науки и научному наследию.

М.В. Ломоносов. Электронное научное издание, создаваемое по технологии и в рамках Фундаментальной электронной библиотеки “Русская литература и фольклор” (http: //feb-web.ru) совместно Институтом лингвистических исследований РАН и Фондом ФЭБ. Электронное издание включает полное собрание сочинений М.В. Ломоносова, энциклопедические сведения о нем, литературу, посвященную великому русскому ученому, а также множество графических и других вспомогательных материалов. Проект находится в стадии реализации и должен быть обнародован в текущем году.

Тексто-графическая база данных по истории российской фундаментальной науки на основе фондов архивов РАН (http: //hp.iitp.ru/index.html). Банк изображений содержит коллекции медалей и знаков, хранящейся в АРАН (Разряд ХIII, около 350 единиц хранения), реляционная база данных включает архивную опись коллекции и связанный с ней банк цифровых изображений.

История физики. Электронная коллекция по истории физики Санкт-Петербургской академии постдипломного педагогического образования (http: //edu.delfa.net/Interest/biography/biblio.htm) содержит несколько десятков книг, составляющих классическое научное наследие отечественных и зарубежных ученых.

История химии. Фундаментальное электронное издание Института истории естествознания и техники РАН (http: //grokhovs.chat.ru/chemhist.html) посвящено истории возникновения и развития химии с древнейших времен до XVII века.

Электронная библиотека Ярославского региона. Электронная библиотека, источниковой базой которой являются собрания и коллекции, хранящиеся в ВУЗах, музеях, библиотеках, архивах, а также в православных храмах Ярославской области.

Еще раз подчеркнем, что приведенный список лишь иллюстрирует степень рассеяния электронных ресурсов по научному наследию. Систематическое изучение существующих ресурсов в данной области — предмет специальной постоянной профессиональной деятельности.

Рассмотрим концептуальные решения по созданию и развитию электронной библиотеки “Научное наследие России”.

Цели и задачи создания ЭБ

В работе [3] сформулированы следующие цели создания ЭБ:

1) предоставление всем желающим через Интернет информации о выдающихся российских ученых, внесших вклад в развитие фундаментальных естественных и гуманитарных наук, с возможностью ознакомления с полными текстами опубликованных ими наиболее значительных работ.

2) обеспечение сохранности оригиналов изданий, являющихся исторической ценностью — возможность работы с цифровыми копиями существенно снижает потребности в работе с печатными материалами, а каждая “книговыдача” на руки раритетных изданий сокращает срок их “жизни”.

3) включение сведений об ученых и основных результатах их научной деятельности в Единое научное информационное пространство (ЕНИП) РАН.

Вероятно, данные формулировки требуют некоторого уточнения. В частности, следует определить круг пользователей ЭБ, в частности, следует ли ориентироваться в основном на специалистов по истории наук, или ЭБ имеет в большей степени популяризаторский характер. Эта альтернатива уже отмечена авторами разработки: следует ли стремиться к полноте отображения научного наследия ученого или достаточно представление его наиболее известных работ.

Далее требует конкретизации понятие “фундаментальных” наук: означает ли это понятие, что в ЭБ принципиально не включаются ученые, чья деятельность в основном носит прикладной характер, в частности, в области техники, медицины, сельского хозяйства, педагогики и проч. Понятно, что ответ на этот вопрос в значительной степени будет определяться отобранными экспертами, т.е. сводится к принципам формирования экспертного совета.

Вероятно, следует и более точно определить понятие исторической ценности издания. Возможными альтернативами являются: формальное определение ценности на основе отражения издания в перечне особо ценных изданий или этот критерий будет определяться именно применительно к созданию данной ЭБ.

Организация и управление ЭБ

К организационным вопросам, которые следует определить в концепции, относятся:

Часть перечисленных вопросов была решена на первом этапе создания системы. Необходимо принять решения по другим, в частности, определить порядок расширения состава участников, имея в виду не только прямое привлечение за счет централизованного финансирования, но и различные формы сотрудничества на основе обмена информацией, технологиями.

По мере расширения библиотеки и перехода ее развития и поддержания на промышленные рельсы, вероятно, понадобится создание специальных структур, обеспечивающих поддержку обеспечивающих компонентов, прежде всего метаданных, словарей и авторитетных файлов, служб мониторинга источников комплектования, координации оцифровки, а также обратной связи с потребителями.

При наличии дополнительных (кроме бюджета РАН) источников финансирования в системе управления понадобится и планово-экономическая служба.

И, наконец, на более поздних этапах развития системы, возможно создание специализированной организации — например, некоммерческого партнерства или фонда (по примеру Фонда ФЭБ), для организации эксплуатации ЭБ.

Экономическая модель ЭБ

Центральным вопросом создания стабильной и устойчивой любой информационной системы, в том числе, естественно, и электронной библиотеки, являются вопросы финансово-экономического обеспечения. В то же время эта проблематика разработана совершенно недостаточно. В принципе возможны 3 экономические модели функционирования ЭБ, элементы которых, конечно, могут сочетаться.

  1. Бюджетная модель. Эта модель предполагает полное финансовое обеспечение системы из бюджета и бесплатное предоставление информации пользователям. Бюджетное финансирование может дополняться грантами из некоммерческих фондов, однако последние по своей природе не могут быть надежным финансовым источником на сколько-нибудь длительную перспективу. Что же касается чисто бюджетного финансирования на постоянной основе, то в условиях РАН это достаточно затруднительный вариант. Скорее всего, даже при благоприятных условиях эта модель сведется к некоторому увеличению сметы для головной организации, что не позволит эффективно развивать систему. Еще сложнее будет реализовать бюджетную модель, если в число участников войдут организации других ведомств или негосударственные организации.
  2. Модель перекрестного субсидирования. Эта модель предполагает бесплатное предоставление информации пользователям и развитие на основе ЭБ некоторых платных сервисов. Типичным для этого варианта является рекламная модель. Делаются также попытки использования других смежных платных сервисов, например, электронной торговли. Эта модель в современных российских условиях позволяет достичь рентабельности только при очень высокой посещаемости ресурса. В то же время есть основания сомневаться, что рассматриваемая ЭБ позволит добиться соответствующей посещаемости.
  3. Модель платного доступа. Эта модель имеет ряд разновидностей, в зависимости от формы сбора платы и форм предоставления доступа. Например, в последнее время интерес специалистов по ЭБ вызвала инициатива компании ЛитРес по организации электронных библиотек с бесплатным чтением и платным копированием произведений из библиотеки (http://users.livejournal.com/magister_/238369.html). Подробно все варианты моделей платного доступа к произведениям в цифровой форме рассмотрены в фундаментальном исследовании А.Б. Долгина [4].

Очевидно, что без решения экономических вопросов практическое создание электронной библиотеки не имеет смысла. Для выработки экономической модели необходимо детально проанализировать размеры затрат на эксплуатацию ЭБ и размеры и формы возможных поступлений. Экономическая модель должна быть разработана до завершения работ по действующей целевой программе.

Правовые вопросы

Промышленно работающая ЭБ должна, очевидно, иметь и соответствующее правовое обеспечение. При этом речь должна идти не только об охране объектов авторского права, хотя эта проблема является самой острой. Необходимо зафиксировать правовой статус ЭБ, права и обязанности участников, обеспечить правовые гарантии сохранности ЭБ и решить ряд других вопросов.

Что же касается охраны авторских прав, то на первом этапе, конечно, возможно ограничиться оцифровкой неохраняемых произведений. Но очевидно, что по мере развития ЭБ это ограничение станет критическим. Поэтому для ЭБ необходимо разработать набор документов, позволяющих решать различные правовые проблемы. Это авторские договора, договора об отчуждении прав, договора с издательствами, договора с партнерами и поставщиками информации, нормативно-правовые акты, регламентирующие передачу в ЭБ служебных произведений и ряд других.

Организация фонда

В работе [3] намечены принципы организации фонда ЭБ “Научное наследие России” на первом этапе ее создания и предполагающие децентрализованное комплектование и централизованное хранение. Однако это слишком общая постановка вопроса. Возможно выделение открытой и закрытой частей фонда (в случае включения в коллекцию охраняемых произведений), наличие основного пользовательского и страхового фонда, формирование в составе фонда коллекций, принадлежащих отдельным поставщикам и другие варианты.

Естественно, возможно и членение фонда по технологическим признакам. На первом этапе распознавание оцифрованных произведений не предполагается. Однако в случае включение в состав участников ЭБ других организаций ситуация может измениться. Так, например ЭНИ “М.В. Ломоносов”, создаваемое в фонде ФЭБ, представлено не только в распознанном и откорректированном виде, но и снабжено глубокой разметкой, позволяющей реализовать много различных дополнительных сервисов для работы с книгами. Отказ от этих сервисов во имя единства фонда представляется нерациональным решением. Альтернативой является организация фонда в виде набора коллекций, обладающих различными функциональными возможностями.

Такие же коллизии возможны и относительно систем метаданных, используемых тематических классификаций и других свойств импортируемых произведений. Опыт показывает, как сложно добиться при децентрализованном комплектовании и обработки единой технологической дисциплины. В этих случаях также представляется возможным создание в составе фонда ЭБ различных по составу метаданных коллекций, при сохранении некоторых возможностей поиска по всему фонду. Собственно, эта идея и является основной при использовании технологий XML и RDFS.

Способы и источники комплектования.

Организация комплектования является главным фактором, влияющим на качество ЭБ. Постоянное противоречие между желанием обеспечить полноту комплектования и технологическими проблемами, вытекающими из взаимодействия с различными источниками, определяет сложность решения данной проблемы. Анализ российских потенциальных источников, приведенный выше, показывает, что число потенциальных источников комплектования очень велико. Однако возможности использования этих источников очень разнятся, в зависимости от качества подготовки информации в различных коллекциях. Теоретически верно было бы разработать технико-экономическую модель, которая бы позволила оценить затраты на комплектование для каждого случая по сравнению с базовым вариантом, который предложен и реализуется на первом этапе развития ЭБ. Однако, насколько нам известно, такой модели для ЭБ пока не существует.

Вообще существуют 4 основные технологии комплектования ЭБ:

  1. Собственная оцифровка;
  2. Получение электронных версий документов в виде рукописей или оригинал-макетов изданий;
  3. Скачивание документов из Интернет;
  4. Получение документов от партнеров по согласованной технологии.

Достоинства и недостатки всех этих технологий, в том числе с экономической точки зрения, достаточно подробно рассмотрены в [1].

Функциональность ЭБ и используемые технологии

В принципе технологические вопросы создания ЭБ “Научное наследие России” в докладе не рассматриваются. Поэтому ограничимся здесь самыми общими замечаниями.

Выбор функциональности системы определяется, прежде всего, целями и задачами ЭБ, а также экономическими факторами. Понятно, что повышение функциональности конфликтует с экономичностью и что при тех же затратах можно увеличить коллекцию за счет функциональности и наоборот.

Подробно возможные функции ЭБ, разработанные на опыте полнофункциональной ЭБ “Русская литература и фольклор”, рассмотрены в [1]. Естественно, что этот набор может быть сокращен и принят более простой вариант, однако необходимая степень простоты должна быть вполне осознана и мотивирована.

Например, в созданной пилотной версии ЭБ вообще отсутствует тематическая классификация изданий и, следовательно, отсутствует возможность тематической навигации по публикациям. Такое упрощение возможности навигации для универсальной по тематике ЭБ кажется чрезмерным. По мере развития фонда, когда число введенных документов достигнет хотя бы нескольких сотен, организация тематической навигации окажется необходимой. Однако понятно, что для этой цели необходимо или рубрицирование всех документов ЭБ по единой классификации или создание переходных таблиц для импортируемых документов, использующих иные классификации.

То же можно сказать о лексическом поиске. Произведения, оцифрованные на первом этапе создания ЭБ, представлены в графическом формате, что исключает возможность лексического поиска по тексту. Однако комплектование ЭБ из других источников документами в символьных форматах позволяет организовать поиск по тексту без особенных дополнительных затрат. Отказ от такой возможности также требует обоснования.

Выводы

Из приведенного обзора с очевидностью следует, что в России существует множество источников информации, которые могут оказаться полезны для наполнения библиотеки “Научное наследие России”. При этом эти источники характеризуются значительной неравномерностью и рассеянием. В этих условиях приоритетной задачей является организация системы мониторинга электронных ресурсов — потенциальных источников комплектования рассматриваемой ЭБ. В качестве инструмента такого мониторинга могут использоваться информационные системы, которые были созданы и поддерживаются при непосредственном участии Российской ассоциации электронных библиотек:

Необходима разработка, обсуждение и утверждение заказчиком концепции ЭБ “Научное наследие России”, в которой должны быть определены основные параметры этой библиотеки с определением первоочередных этапов ее развития, а также в расчете на длительную перспективу. Важное место в концепции должна занять экономическая модель ЭБ.

Литература

  1. Антопольский А.Б., Майстрович Т.В. Электронные библиотеки: принципы создания. — Либерея, М. 2007, 284 с.
  2. Towards a Cultural Heritage Digital Library/ G. Crane, C. Wulfman etc. — Perseus Project, Tufts University, Medford MA 02155.
  3. Н.Е. Калёнов, Г.И. Савин, А.Н. Сотников Электронная библиотека “Научное наследие России”: технология наполнения (публикация в настоящем сборнике).
  4. Долгин А.Б. Экономика символического обмена. М.: Инфра-М, 2006.