ИНТЕГРАЦИЯ БИБЛИОТЕЧНЫХ
РЕСУРСОВ В ЕИС РАН
Н.Е. Калёнов
(БЕН
РАН),
В.А. Серебряков
(ВЦ РАН)
Академические библиотеки в современных условиях являются не только и не столько собирателями и хранителями научной литературы в традиционном понимании, сколько информационными центрами, осуществляющими поиск и предоставление пользователям электронной информации. Библиотеки приобретают различные базы данных на современных носителях и размещают их на своих серверах, приобретают права доступа для своих читателей к электронным публикациям, формируют собственные электронные ресурсы.
Информация, формируемая в библиотеках РАН, представляет значительный интерес, как для сотрудников РАН, так и для "внешних" потребителей - специалистов, занимающихся исследованиями в научных организациях различных ведомств и ВУЗах страны. Поэтому библиотечная составляющая является неотъемлемой частью информационных систем общего назначения, разрабатываемых в РАН [1]. Web-портал РАН, являющийся первой очередью единой информационной системы (ЕИС) РАН [2], включает специальный раздел, озаглавленный "Библиотеки". Доступ к нему осуществляется с основной страницы Портала (
http://uis.isir.ras.ru) через ссылку "Издания и издательства". В этом разделе представлена общая информация о структуре библиотечной системы РАН, приведен список академических библиотек, имеющих Интернет-сайты, представлено описание их ресурсов.Основными ресурсами, представленными в Интернет библиотеками, являются их электронные каталоги. Глубина ретроспективы электронных каталогов академических библиотек существенно различается. Центральные библиотеки, такие как БЕН и ГПНТБ СО РАН, ведут электронные каталоги, начиная с определенного момента времени, полностью обрабатывая все текущие поступления литературы. Библиотеки институтов, для которых важным является обеспечение как можно большей глубины ретроспективы каталогов, вводят в них описания литературы прошлых лет. В первую очередь, это касается научных журналов - полные их каталоги сформированы в ряде отделений БЕН - библиотеке Математического института РАН, в центральной библиотеке Пущинского научного центра (ЦБ ПНЦ). В ЦБ ПНЦ формируется также по специальной методике, основанной на использовании баз данных РКП и ГПНТБ России, ретроспективный каталог книг.
В настоящее время ведутся работы по созданию программной среды и технологии объединения каталогов различных академических библиотек в рамках ЕИС РАН.
Необходимо отметить, что требования к библиотечным ресурсам, отражаемым в ЕИС РАН, в значительной степени отличаются от требований к библиографической информации, формируемой национальными "библиографирующими" центрами - Российской книжной палатой (РКП), Российской государственной библиотекой (РГБ) и Российской национальной библиотекой (РНБ). Эти центры формируют исчерпывающую информацию о каждом издании, дробя её на значительное число отдельных элементов - полей и подполей. Правила выделения элементов определяются принятым в стране форматом РУСМАРК [см., например,
http://www.rba.ru:8101/rusmarc/ index.html], включающим несколько сотен полей. Такое детальное представление библиографических данных имеет определенное значение для профессиональных библиографов и библиотекарей. Однако для пользователей, цель которых найти ту или иную книгу по тем сведениям, которыми они располагают, смысла в представлении библиографической информации по полям формата РУСМАРК (или другого, подобного ему) нет никакого. Более того, у подавляющего большинства пользователей возникают вопросы, когда они видят наименования многих принятых в библиотечном деле элементов библиографических данных (таких, например, как "последующие сведения об ответственности", "сведения, относящиеся к заглавию" и т.п.). Как показал опрос пользователей-сотрудников РАН, многие из них неверно трактуют такое "элементарное" для библиотечных специалистов понятие, как "коллективный автор", считая это списком авторов, а не организацией, подготовившей материал. Рядовой пользователь-ученый РАН знает всего лишь несколько понятий из библиографического описания, таких как "автор" (имея в виду только индивидуального автора и не различая первичные и вторичные "сведения об ответственности"), "заглавие" (его не волнует, где граница между основным и параллельным заглавиями, где заглавие серии и т.п.), "год издания", "издательство", иногда - "вид издания". Очевидно, что искать нужное ему издание он будет по этим полям. Поэтому поисковой системе, рассчитанной на неподготовленного в библиотечном отношении пользователя (каковыми являются в своем большинстве сотрудники РАН), достаточно обеспечивать поиск лишь по этим элементам данных. Чтобы компенсировать возможности потери информации при поиске из-за неправильного понимания пользователями библиотечной терминологии, система должна допускать поиск по всем словам из библиографического описания публикации.В академической библиотечной системе принципиальным моментом является форма выдачи результатов поиска. Если в "профессиональных" библиотечных системах предусмотрена выдача результатов поиска в различных форматах (РУСМАРК, USMARC, UNIMARC) в виде полных библиографических записей, (содержащих, наряду с библиографической, всю служебную информацию), в виде списков вида <метка (или наименование) поля> <содержимое поля>, то в библиотечной части ЕИС необходимо и достаточно представлять результаты поиска в виде стандартных кратких библиографических описаний, чтобы пользователь при подготовке статьи или диссертации мог их скопировать и без существенного редактирования поместить в свой список пристатейной библиографии. Эти описания, естественно, должны быть дополнены информацией о местонахождении изданий и их шифрами хранения.
Учитывая эти особенности академической системы, при решении задачи включения библиографической информации в ЕИС РАН, был разработан формат представления данных, основанный на использовании стандарта Dublin Core Metadata и языка XML в стандарте RDF [1]. В рамках этого формата библиографическое описание издания представляется одним тегом, а дополнительно отдельно формируются сведения о всех персоналиях, упоминающихся в библиографическом описании, год издания, язык, предметные рубрики, сведения о местонахождении издания, шифры хранения.
В настоящее время отлаживаются программные средства, обеспечивающие загрузку данных в ЕИС из сводных каталогов журналов и книг, формируемых в БЕН РАН. Каталог журналов отражает все поступления, начиная с 1990 года, каталог книг - с 1993-го года. В этих каталогах содержится информация о библиотеках, в которые направлено каждое издание (БЕН РАН обеспечивает централизованное комплектование фондов около 150-ти библиотек академических институтов), поэтому информация, загруженная из них, создаст достаточно серьезную основу для развития библиотечной составляющей ЕИС РАН.
Программное обеспечение интегрированной системы информационных ресурсов (ИСИР) РАН [3], являющееся базовым для ЕИС РАН, предоставляет возможность поиска и развитой навигации по связанным ресурсам разного рода - метаописаниям организаций, персоналий, публикаций. Поэтому загрузка каталогов библиотек академических институтов в ЕИС РАН позволит реализовать общеакадемическую систему поиска и заказа литературы, обеспечить связь между информацией о сотрудниках РАН и подготовленных ими изданиях, имеющихся в фондах академических библиотек.
Другим направлением, связанным с интеграцией библиотечных ресурсов в ЕИС РАН, является подготовка и загрузка в систему сведений о публикациях сотрудников академических институтов. Эти сведения имеются в библиотеке каждого института в виде традиционных "картотек трудов сотрудников". Если в каталогах библиотек отражаются книги, сборники в целом, журналы, продолжающиеся издания как "единицы хранения", то в картотеках содержатся, в основном, описания статей, авторами которых являются сотрудники данного института. Несколько лет назад в БЕН РАН при поддержке РФФИ был разработан унифицированный комплекс программ "Наука России", обеспечивающих ввод и поддержку баз данных трудов сотрудников [4]. В этот настраиваемый комплекс, появившийся до ИСИР РАН, был заложен ряд принципов, аналогичных ИСИР - он поддерживает 4 связанные "подбазы", содержащие, соответственно, описания организаций, персоналий, публикаций на аналитическом уровне (статьи), источников (публикаций на монографическом уровне - журналов, сборников и т.п.). Комплекс установлен в ряде библиотек академических институтов, где накоплены достаточно серьезные массивы данных. Некоторые из них представлены на сервере БЕН РАН (
http://www.benran.ru/Magazin/cgi-bin/ sr1_n.exe?Magazin/inaros/inaros.ini). В настоящее время в рамках проекта, поддерживаемого РФФИ (грант 02-07-90088), ведутся работы по вводу и актуализации данных, формируемых в системе "Наука России", в ЕИС РАН. Проблема первоначальной загрузки данных успешно решена - в ЕИС загружены сведения о сотрудниках БЕН РАН и их публикациях со ссылками на полные тексты. Ознакомиться с системой поиска и навигации по этим ресурсам можно с сайта ЕИС РАН, перейдя с главной страницы в режим "ПОИСК", выбрав "Поиск организаций" и задав в поле "Сокращенное название" значение "БЕН". Информация была выгружена из системы "Наука России" в согласованном DC/XML/RDF-формате, о котором шла речь выше, и загружена в ЕИС РАН в пакетном режиме с помощью программы-загрузчика, разработанной специалистами ВЦ РАН. Программа-конвертер, обеспечивающая выгрузку данных, разработана специалистами БЕН РАН.Определенная проблема, над которой идет сейчас работа, связана с актуализацией в ЕИС РАН данных, поступающих из библиотечных систем. Для её решения необходима модификация средств ввода данных, используемых в библиотеках, и разработка специальных программных средств, встроенных в загрузчик данных ИСИР.
В качестве перспективных работ, связанных с развитием библиотечной составляющей ЕИС РАН, можно назвать проект формирования метабазы данных по диссертациям, защищенным в РАН, проект реализации распределенной системы заказа и электронной доставки документов.
Литература