НОВЫЕ ТЕХНОЛОГИИ В ИНФОРМАЦИОННОМ ОБЕСПЕЧЕНИИ НАУКИ

Библиотечная составляющая ИСИР РАН

С.А. Власова, Н.Е. Калёнов
(БЕН РАН)
П.М. Курив
(ЦНТК РАН)
В.А. Серебряков
(ВЦ РАН)

В 1997 году руководством РАН было принято решение о развертывании работ по созданию Интегрированной Системы Информационных Ресурсов (ИСИР) РАН [1].

Основной целью разработки ИСИР РАН является объединение информационных ресурсов различного типа, имеющихся в учреждениях РАН, в единую систему, обеспечивающую их поддержку и предоставление пользователям Интернет. В основе концепции построения ИСИР РАН лежит современная технология открытых систем, предполагающая использование единой метаинформации, описывающей ресурсы различного типа.

Среди ресурсов, поддержку которых должна обеспечивать ИСИР РАН, значительная доля приходится на информацию, в той или иной мере связанную с публикациями научных результатов, с которой традиционно оперируют библиотеки разного уровня, входящие в состав институтов, отделений или непосредственно подчиняющиеся Президиуму РАН.

В связи с этим в состав ИСИР РАН, в качестве одной из основных компонент, была введена библиотечная составляющая (БС).

Информационные ресурсы, генерируемые и поддерживаемые в рамках БС ИСИР РАН, включают:

  • сводные электронные каталоги фондов централизованных библиотечных систем РАН, возглавляемых Центральными библиотеками РАН, являющимися федеральными информационными центрами (БАН, БЕН, ГПНТБ СО РАН), а также центральными библиотеками тех отделений, научных центров и филиалов РАН, где имеется соответствующая организационная структура;
  • локальные электронные каталоги фондов библиотек НИИ РАН;
  • реферативные и полнотекстовые базы данных, доступные библиотекам РАН;
  • библиографические сведения, отражающие публикации сотрудников РАН;
  • электронные копии публикаций сотрудников РАН;
  • библиографические сведения, отражающие отчеты по проектам, выполняемым в институтах РАН;
  • электронные копии отчетов по проектам, выполняемым в институтах РАН.

В процессе функционирования ИСИР РАН библиотечная составляющая должна выполнять следующие функции:

  • загрузка сводных и локальных электронных каталогов, формируемых в библиотеках РАН, на сервера ИСИР;
  • прием заказов на материалы (или копии их фрагментов), имеющиеся в фондах академических библиотек, от пользователей ИСИР РАН в интерактивном режиме; постановка на очередь в случае временного отсутствия заказываемых изданий в фондах;
  • ввод в ИСИР текущих (получаемых от авторов) и ретроспективных (на основании традиционных картотек, имеющихся в библиотеках НИИ РАН) данных о публикациях сотрудников институтов РАН;
  • ввод в ИСИР полных текстов публикаций сотрудников РАН по поручению авторов (с соблюдением законов об охране авторских прав);
  • ввод в ИСИР данных о научных отчетах (включая библиографию, рефераты и полные тексты), получаемых от ученых секретарей институтов;
  • редактирование библиографических данных, введенных в ИСИР сотрудниками РАН (концепция построения ИСИР допускает возможность ввода данных авторизованными пользователями);
  • обеспечение сохранности электронных информационных ресурсов библиотечной составляющей ИСИР РАН;
  • предоставление статистических сведений различного рода о работе БС ИСИР.

Для реализации перечисленных функций в процессе разработки ИСИР РАН решаются следующие задачи:

  • включение в общую структуру ИСИР РАН библиотечной составляющей; определение связей ресурсов БС с другими ресурсами ИСИР;
  • разработка системы метаданных для описания информационных ресурсов БС ИСИР РАН;
  • разработка программных средств, обеспечивающих загрузку в ИСИР информации, созданной в локальных библиотечных автоматизированных системах РАН;
  • разработка технологии текущего пополнения и редактирования информационных ресурсов БС ИСИР;
  • отработка пользовательского интерфейса для поиска и представления информации, входящей в состав БС ИСИР включающего: перечень поисковых полей, логику формирования поискового предписания, формат представления данных на экране, возможности выдачи информации на принтер и в файл;
  • разработка специальных программных средств, обеспечивающих "обслуживание читателей".

Включение библиотечных ресурсов в ИСИР РАН связано с определенной сложностью, обусловленной тем, что многие библиотеки (как центральные, так и институтские) уже длительное время работают в автоматизированном режиме и накопили значительные массивы электронной информации. Сюда относятся каталоги фондов, библиографические и реферативные базы данных, полнотекстовые электронные документы. При этом библиотеки используют различные программные средства и форматы представления данных, что существенно затрудняет интеграцию их информационных ресурсов в ИСИР.

С другой стороны, академические библиотеки накопили значительный опыт в разработке и поддержке автоматизированных систем и предоставлении электронной информации пользователям, в связи с чем они могут внести существенный вклад в создание ИСИР РАН. Исходя из этого, в 2000 г. к разработке Библиотечной составляющей ИСИР были привлечены специалисты отдела системных исследований и автоматизированной технологии БЕН РАН. В течение 2000г. были решены два комплекса задач. Первый связан с разработкой системы метаданных для описания библиографических ресурсов, второй - с разработкой алгоритмов и программ, обеспечивающих загрузку в ИСИР РАН данных из системы "Наука России" [2].

В качестве основы метаданных была выбрана схема DUBLIN CORE METADATA и язык XML в стандарте RDF [3]. Базовый набор элементов DUBLIN CORE был расширен за счет введения специальных квалификаторов, обеспечивающих идентификацию библиографических ресурсов. Поскольку ИСИР РАН ориентирована на работу с пользователями и не является технологической библиотечной системой, разработчиками была принята концепция, согласно которой профессиональную библиографическую обработку изданий библиотеки РАН осуществляют на базе существующих у них программных средств (при этом может использоваться детальное представление всех элементов библиографического описания, предусмотренное библиотечными форматами семейства MARC). Вся введенная в библиотеках информация загружается в ИСИР, однако при поиске ИСИР оперирует лишь ограниченным набором элементов данных - персоналии, имеющие отношение к публикации (авторы, редакторы и т.п.), авторские коллективы, даты публикации, стандартные номера ISBN и ISSN. Кроме поиска по этим элементам данных предусмотрен поиск по всем словам, (за исключением настраиваемого словаря "стоп-слов"), входящим в библиографическое описание документа в стандарте ГОСТ 7.1-84.

Система "Наука России", информацию из которой было решено загружать на первом этапе создания БС ИСИР РАН, разрабатывается специалистами БЕН РАН по гранту РФФИ (проект 99-07-90053) как типовая система, устанавливаемая в библиотеках НИИ РАН, обеспечивающая децентрализованную подготовку баз данных трудов сотрудников академических институтов. В настоящее время система установлена в библиотеках многих институтов, где накоплены, в общей сложности, десятки тысяч описаний публикаций. База данных системы включает 4 взаимосвязанные подбазы - персоналий (сведения о сотрудниках РАН - авторах публикаций), организаций (наименования, адреса академических учреждений, в которых работают сотрудники, включенные в подбазу персоналий), публикаций (описания публикаций на аналитическом уровне), источников (описания изданий на монографическом уровне и сводном уровнях).

В 2000 г. была разработана версия программного комплекса, обеспечивающего конвертирование информации из баз данных "Наука России" в согласованный формат "DC/XML/RDF". Подробная информация о ней приведена в [3]. Тестовый массив, полученный на основе обработки реальной базы данных, был загружен в ИСИР, однако возникла проблема эксплуатации системы в технологическом режиме, связанная с актуализацией информации. Ввод данных сотрудниками библиотек НИИ РАН в систему "Наука России" идет постоянно, загрузка данных в ИСИР РАН осуществляется периодически в пакетном режиме. Для полной идентификации ресурсов, загружаемых в ИСИР РАН, и исключения повторного ввода уже существующей актуальной информации возникла необходимость уточнения набора элементов данных.

Для ресурса "Публикации" добавлен идентификатор, вычисляемый на основе атрибутов данного ресурса по специальному алгоритму, разработанному в рамках системы "Наука России" (квалификатор значения поля Identifier - dcs.Hash).

Для всех типов ресурсов добавлено свойство modified - дата последней модификации ресурса. Дата в записях ресурсов имеет вид ГГГГ-ММ-ДД. В связи с тем, что записи баз данных "Наука России" не содержали даты модификации, была разработана специальная программа первоначального добавления дат во все записи уже существующих ресурсов. Обеспечение текущего ввода дат осуществляется путем специальной настройки программы ввода данных системы "Наука России".

При конвертировании данных системы "Наука России" в ИСИР РАН все записи ресурсов получают идентификационный номер, состоящий из трехсимвольного имени ресурса ("org", "per", "pub"), точки, двухсимвольного кода библиотеки, принятого в ЦБС БЕН РАН, и номера записи в соответствующей исходной подбазе данных.

Изложенные выше изменения были внесены в программу конвертирования данных системы "Наука России" в ИСИР РАН. Ниже приводится пример, содержащий две выгруженные публикации (статья из сборника и статья из журнала) с четырьмя различными персоналиями - авторами этих публикаций, и одной организацией, в которой они работают: (1) Калёнов Н.Е., Васильев А.В., Власова С.А., Глушановский А.В. Автоматизированная информационная система "Наука России". // Информационно-библиотечное обеспечение науки: Проблемы интеграции информационных ресурсов, 1995. - С.112-115 и (2) Власова С.А. Автоматизированная система обслуживания читателей научной библиотеки // НТИ. Сер. 1., 1993. - N. 2. - С.16-19.

Информация подготовлена БЕН РАН, код которой - hh.

В результате работы программы конвертирования формируется следующий текстовый файл:

<?xml version="1.0" encoding="ISO-8859-1"?>

<rdf:RDF xml:lang="ru"

xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.0/"

xmlns:isir="x-isir.ras.ru:">

<!-- организации -->

<isir:organization rdf:about="x-ben.irex.ru:org.hhO305">

<isir:modified>2000-11-29</isir:modified>

<isir:orgname>Библиотека по естественным наукам РАН</isir:orgname>

<isir:orgabbr>БЕН</isir:orgabbr>

<isir:address zipcode="119890" city="Москва" rdf:value="ул. Знаменка, 11"/></isir:organization>

<!-- персоналии -->

<isir:person rdf:about="x-ben.irex.ru:per.hhP23">

<isir:modified>2000-11-29</isir:modified>

<isir:name>Калёнов Н.Е.</isir:name>

<isir:employer rdf:resource="x-ben.irex.ru:org.hhO305"/>

</isir:person>

<isir:person rdf:about="x-ben.irex.ru:per.hhP100">

<isir:modified>2000-11-29</isir:modified>

<isir:name>Васильев А.В.</isir:name>

<isir:employer rdf:resource="x-ben.irex.ru:org.hhO305"/></isir:person>

<isir:person rdf:about="x-ben.irex.ru:per.hhP498">

<isir:modified>2000-11-29</isir:modified>

<isir:name>Власова С.А.</isir:name>

<isir:employer rdf:resource="x-ben.irex.ru:org.hhO305"/></isir:person>

<isir:person rdf:about="x-ben.irex.ru:per.hhP504">

<isir:modified>2000-11-29</isir:modified>

<isir:name>Глушановский А.В.</isir:name>

<isir:employer rdf:resource="x-ben.irex.ru:org.hhO305"/></isir:person>

<!-- публикации -->

<isir:publication rdf:about="x-ben.irex.ru:pub.hhS317">

<dc:Type rdf:resource="x-ben.irex.ru:dct.Type.s"/>

<isir:modified>2000-11-29</isir:modified>

<dc:Title> Информационно-библиотечное обеспечение науки: Проблемы интеграции информационных ресурсов</dc:Title></isir:publication>

<isir:publication rdf:about="x-ben.irex.ru:pub.hhA317"><dc:Title> Автоматизированная информационная система "Наука России"</dc:Title>

<dc:Identifier rdf:parseType="Resource"><isir:vq

rdf:resource="x-ben.irex.ru:dcs.Hash"/><rdf:value>ИБОН=1995112</rdf:value></dc:Identifier>

<dc:Creator rdf:resource="x-ben.irex.ru:per.hhP23"/>

<dc:Creator rdf:resource="x-ben.irex.ru:per.hhP100"/>

<dc:Creator rdf:resource="x-ben.irex.ru:per.hhP498"/>

<dc:Creator rdf:resource="x-ben.irex.ru:per.hhP504"/>

<dc:Relation rdf:parseType="Resource">

<isir:eq rdf:resource="x-ben.irex.ru:dcq.Relation.PartOf"/>

<rdf:value rdf:resource="x-ben.irex.ru:pub.hhS317"/></dc:Relation>

<isir:modified>2000-11-29</isir:modified>

<dc:Date>1995</dc:Date><dc:Description rdf:parseType="Resource">

<isir:eq rdf:resource="x-ben.irex.ru:dcq.Description.Pages"/>

<rdf:value>112-115</rdf:value></dc:Description>

<dc:Language>ru</dc:Language></isir:publication>

<isir:publication rdf:about="x-ben.irex.ru:pub.hhS348">

<dc:Type rdf:resource="x-ben.irex.ru:dct.Type.s"/>

<isir:modified>2000-11-29</isir:modified>

<dc:Title> НТИ. Сер. 1.</dc:Title></isir:publication>

<isir:publication rdf:about="x-ben.irex.ru:pub.hhM34819932">

<dc:Type rdf:resource="x-ben.irex.ru:dct.Type.m"/>

<dc:Relation rdf:parseType="Resource">

<isir:eq rdf:resource="x-ben.irex.ru:dcq.Relation.Serial"/>

<rdf:value rdf:resource="x-ben.irex.ru:pub.hhS348"/></dc:Relation>

<dc:Description rdf:parseType="Resource">

<isir:eq rdf:resource="x-ben.irex.ru:dcq.Description.Issue"/>

<rdf:value>(2)</rdf:value></dc:Description><dc:Date>1993</dc:Date></isir:publication><isir:publication rdf:about="x-ben.irex.ru:pub.hhA348">

<dc:Title>Автоматизированная система обслуживания читателей научной библиотеки.</dc:Title><dc:Identifier rdf:parseType="Resource">

<isir:vq rdf:resource="x-ben.irex.ru:dcs.Hash"/>

<rdf:value>НТИС11993216</rdf:value></dc:Identifier>

<dc:Creator rdf:resource="x-ben.irex.ru:per.hhP498"/>

<dc:Relation rdf:parseType="Resource">

<isir:eq rdf:resource="x-ben.irex.ru:dcq.Relation.PartOf"/>

<rdf:value rdf:resource="x-ben.irex.ru:pub.hhM34819932"/></dc:Relation>

<isir:modified>2000-11-29</isir:modified>

<dc:Description rdf:parseType="Resource">

<isir:eq rdf:resource="x-ben.irex.ru:dcq.Description.Pages"/>

<rdf:value>16-19</rdf:value></dc:Description>

<dc:Language>ru</dc:Language>

</isir:publication>

</rdf:RDF>

Таким образом, в настоящее время реализована возможность технологической загрузки данных, формируемых с помощью программного обеспечения системы "Наука России" в библиотеках НИИ РАН, не только на автономный WEB-сервер (см. http://195.178.196.201/N_r1.htm), но и в интегрированную систему информационных ресурсов РАН.

В заключение необходимо отметить, что БС ИСИР РАН будет играть важную роль в информационном обеспечении пользователей тогда и только тогда, когда её будет поддерживать специальная организационная структура, причем речь идет не о технической поддержке (что очевидно), а об информационной - необходимо постоянно контролировать актуальность и качество информации, циркулирующей в системе. Ввод и редактирование информации "на добровольных началах" сотрудниками РАН приведет к тому, что очень скоро система, с одной стороны, будет "замусорена" некорректными данными, а, с другой стороны, в ней будет отсутствовать важная информация.

С нашей точки зрения, организационная структура БС ИСИР РАН, обеспечивающая поддержку и сохранность информационных ресурсов, должна опираться на сложившуюся и успешно работающую в РАН систему научных библиотек. Последняя состоит из совокупности централизованных библиотечных сетей (ЦБС), каждая из которых возглавляется Центральной библиотекой (ЦБ) и объединяет библиотеки НИУ РАН по территориальному (СО РАН, Санкт-петербургский НЦ, УрО РАН и др.) или тематическому (БЕН РАН, ИНИОН) признакам.

Научная библиотека имеется в каждом НИИ РАН. Хотя взаимоотношения библиотек с институтами и ЦБ различны (какие-то библиотеки являются подразделениями ЦБ, какие-то - подразделениями институтов), все они в той или иной мере связаны с соответствующими ЦБ и институтами; многие сотрудники библиотек за последние годы накопили большой опыт работы с электронными информационными ресурсами.

Представляется целесообразным, чтобы в штат библиотеки каждого НИУ РАН был введен один сотрудник (с финансированием, позволяющим принять на работу достаточно квалифицированного специалиста - библиографа, имеющего опыт работы с компьютером на уровне пользователя) - локальный администратор БС ИСИР РАН, задачами которого должны являться формирование и актуализация информации, относящейся к данному НИИ. Этот сотрудник должен работать в тесном контакте с ученым секретарем и специальным сотрудником НИИ, отвечающим за поддержку узла ИСИР в данном институте. Соответственно, в каждой библиотеке должен иметься хотя бы один современный компьютер, обеспечивающий ввод данных в БС ИСИР (необходимо заметить, что во многих библиотеках компьютеры установлены, но подавляющее их число было передано библиотекам институтами "за ненадобностью" и они являются морально и физически устаревшими).

Для координации и методического руководства деятельностью локальных администраторов в каждой ЦБ создается "узел БС ИСИР" - небольшая группа специалистов - (от 2-х до 8-ми человек, в зависимости от количества "обслуживаемых точек"), в задачи которой входит установка и настройка программного обеспечения в библиотеках НИУ, разработка инструктивно - методических материалов, консультирование локальных администраторов, участие в развитии БС ИСИР РАН.

В бюджете РАН должны быть предусмотрены специальные средства на поддержку БС ИСИР РАН, которые должны расходоваться на заработную плату администраторов и поддержку технической базы.

Литература

  1. А.Н. Бездушный, А.Б. Жижченко, М.В. Кулагин, В.А. Серебряков. Интегрированная система информационных ресурсов РАН и технология разработки цифровых библиотек // Программирование, 2000, № 4. - C. 3-14
  2. Васильев А.В., Власова С.А., Глушановский А.В., Калёнов Н.Е. Система "Наука РОССИИ" и её использование в информационно-библиотечной технологии // Информационное обеспечение науки: новые технологии. Сб. науч. тр. - М. 1997. - С.86 - 88
  3. Бездушный А.Н., Власова С.А., Калёнов Н.Е. Меденников А.М., Серебряков В.А., Подход к интеграции информационных коллекций В ИСИР РАН // Электронные библиотеки: перспективные методы и технологии, электронные коллекции. 2-я Всероссийская научная конференция. Сб. докладов. (Сентябрь, 26-28, 2000. - Протвино). - М., 2000. - С. 129-135