О концепции системы научной информации в сфере педагогики и психологии

Антопольский А.Б.
(Институт научной информации и мониторинга РАО)

Настоящий доклад содержит  предложения  по созданию и развитию системы научной информации в области педагогики и психологии на основе идеологии и технологии Инициативы открытых архивов. Концепция предназначена для реализации в институтах Российской академии образования  с привлечением всех заинтересованных научных коллективов.
Потребители  научно-педагогической информации
Общее число  ученых, занятых в этой сфере,  т.е. потенциальных пользователей системы научно-педагогической информации (НПИ),  можно оценить  приблизительно в 100 тыс. чел.,  что  составляет около 10 % от общего числа занятых в сфере науки в России.
В системе НПИ отсутствуют специализированные организации потребителей  и производителей информации. Участие в больших информационно-библиотечных консорциумах (НЭИКОН, АРБИКОН) для пользователей НПИ весьма ограничено и не слишком выгодно.
Общая характеристика  ресурсов НПИ
Так же как наука в сфере образования является частью сферы образования  в целом, информационные ресурсы НПИ  России являются частью гораздо более крупных по масштабу информационных ресурсов сферы образования. При этом выделение собственно НПИ среди образовательных ресурсов является трудной и не всегда выполнимой задачей. Поэтому данные, приводимые ниже, отчасти относятся не только к НПИ, но и ко всем образовательным ресурсам в целом.
Ресурсы НПИ в настоящее время представляют значительное по объему, но плохо структурированное информационное пространство. Среди информационных систем и  ресурсов НПИ наблюдается значительное дублирование.
Библиотечные фонды  системы НПИ
Крупнейшим хранителем НПИ, как и образовательных ресурсов в целом, является сеть библиотек образовательных учреждений. К их числу относятся библиотеки вузов, (около 3 тыс.) и в значительном количестве библиотеки средних специальных и общих учебных заведений. Общее число библиотек сферы образования достигает 60 тыс. Крупнейшим фондом в сфере НПИ является фонд НПБ им К.Д. Ушинского  объемом 1,6 млн ед. хран. Данные о доле НПИ в других библиотечных фондах отсутствуют.
Книжные ресурсы системы НПИ
Основным видом опубликованной  НПИ  являются книги. Общее число книг учебно-образовательного назначения, выходящих в России, по данным Российской книжной палаты составляет до 30 тыс. наименований в год.
Периодика в сфере «Педагогика» и «Психология»
В отчете Н.К. Ханнанова [ 1 ] достаточно подробно проанализировано состояние журналов в данной области, наличие их в Интернет в свободном или платном доступе, а также их наличие в Научной электронной библиотеке и в депозитарии электронных научных изданий НТЦ «Информрегистр». Их общее число достигает 350.
Архивы
Крупнейшим и, видимо, единственным специализированным архивом НПИ является Научный архив РАО, переданный в состав НПБ, Его объем определяется в 100 тыс. дел, сгруппированных  в 130 фондов. Имеются отрывочные сведения о наличие НПИ в других архивах - как федеральных (ГАРФ, РГИА), так и региональных.
Интерес представляет содержание фондов Российского государственного исторического архива (РГИА). Известно, что эти фонды содержат все материалы Министерства народного просвещения Российской империи с момента его создания в начале 19-го века до Февральской революции. В настоящее время идет активная оцифровка фондов РГИА в рамках участия в создании  Президентской библиотеки им. Б.Н. Ельцина. Однако доля НПИ в оцифрованной части фондов РГИА неизвестна..
Музеи.
Имеются специализированные музеи, посвященные истории образования, особенно в учебных заведениях. Кроме того, практически, все региональные и краеведческие музеи содержат материалы, связанные с историей образования в соответствующих регионах России.
Образовательные ресурсы российского Интернета
Каталог Яндекса относит к категории образовательных  св. 5 тыс. сайтов и порталов (из общего числа около 100 тыс.), Каталог Топ 100 Рамблера относит к этой категории 6,9 тыс.  из  около 200 тыс сайтов.
Каталог электронных библиотек НП ЭЛБИ  относит к рубрикам «Психология» и «Педагогика» св. 350 электронных коллекций (не считая коллекций универсальной тематики, в которых образовательные ресурсы  часто составляют заметную долю.)
Из вторичных ресурсов самым крупным является каталог образовательных ресурсов Интернет в рамках «Единого окна доступа к образовательным ресурсам». По состоянию на 01.04.2009 г. он включает 45 тыс. описаний и ссылок на ресурсы образовательного назначения различных типов – как на отдельные документы различных типов, так и на целые  массивы,  такие как  электронные издания,  электронные библиотеки, сайты целиком и проч.
Крупнейшими владельцами НПИ, представленной в электронном виде,  являются:

Научные учреждения РАО, с некоторыми оговорками, не являются заметными  производителями электронных ресурсов НПИ.
Инициатива открытых архивов в России
Инициатива открытых архивов (Open Archive Initiative - OAI) однозначно признается специалистами как наиболее перспективная модель распространения научно-образовательной информации и должна быть положена в основу системы научно-педагогической информации в России. ОАI  в России действует с 2002 г. главным образом усилиями С.И. Паринова. В настоящее время на базе ЦЭМИ РАН действует межинститутская группа «СОЦИОНЕТ» [ 2 ], оказывающая помощь институтам Отделения общественных наук (ООН) РАН в создании и развитии их собственных электронных коллекций с использованием идеологии и технологии ОАI. 
Использование сервисов Соционет открывает сотрудникам институтов ООН РАН, а также другим ученым, возможность использования новых средств получения и распространения научных материалов в общероссийской и международной профессиональной среде, включая самоархивирование, электронное депонирование и открытые архивы [ 3 ] .
Открытые архивы можно рассматривать не только как технологическую инновацию, позволяющую сократить издержки и ускорить диффузию знаний, но и как организационно-управленческую. Добавление в систему открытого архива наукометрического и рейтингующего компонентов может дополнительно стимулировать авторов к депонированию результатов научной деятельности, считает С.И. Паринов. В 2006 году он инициировал программу «Открытый доступ к результатам исследований», предполагающую создание единой инфраструктуры для оперативного распространения и использования результатов научных исследований. Сегодня «Соционет» уже объединяет архивы 22  институтов ООН РАН.
Институты создают свои внутренние архивы, взяв за основу открытую архитектуру «Соционета», принимают положения об обязательном электронном депонировании результатов исследований в институтском архиве.
 Принципы организации системы НПИ
Основным принципом  функционирования системы НПИ является принцип открытого, свободного и бесплатного доступа к научно-педагогической информации для конечного пользователя.
Координация  деятельности по созданию коллекций  НПИ основывается на принципах минимизации общественных затрат на эту деятельность при согласованных параметрах роста коллекций.
Участники системы НПИ признают авторское право, и доступ к охраняемым произведениям будут предоставлять в соответствии с правилами, установленными 4-й частью Гражданского Кодекса РФ. При этом участники системы  стремятся развивать альтернативные способы распространения научно-образовательной информации, в том числе в форме присоединения к OAI и использования правовой модели Common Creative License.
Участники системы могут, кроме открытых архивов и коллекций,  создавать ресурсы ограниченного доступа, в том числе охраняемые авторским правом и  доступные только в помещениях библиотек, а также охраняемые персональной тайной и доступные только с разрешения субъектов персональных данных.
Создание системы НПИ основывается на  принципе конвергенции: участники системы должны развивать свои ресурсы и сервисы  в направлении координации своих действий и создания единого информационного пространства НПИ, постепенно, с минимальными изменениями своих системных решений.
Интероперабельность системных решений достигается путем принятия общих стандартов, как правило, дополняющих уже реализованные  решения. Принципы интероперабельности основываются на технологических решениях OAI и действующей в России системы Соционет.
Участие в системе НПИ является обязательным для учреждений РАО и добровольным для других научно-педагогических институций.
В составе системы НПИ выделяются три головные организации: НПБ им. К.Д. Ушинского, ИНИМ РАО и ГНИИ ИТТ «Информика». Все системные решения принимаются на основе консенсуса этих организаций с учетом мнений остальных участников.
 Функциональная структура системы НПИ
Система НПИ  включает следующие два взаимосвязанных блока.

1) Информационные системы участников, где они ведут свою электронную информационную деятельность, в том числе, в форме институтских открытых архивов (ОА);

2) Сервисы онлайновой научной инфраструктуры, которые интегрируют локальные ОА и создают из них общее информационное пространство.

В составе системы НПИ могут создаваться функциональные блоки, которые строятся с учетом опыта создания системы Соционет:

Организация доступа к внешним источникам
Для доступа к внешним ресурсам НПИ, предоставляемым на  коммерческих условиях, создаются консорциумы, минимизирующие затраты для участников системы НПИ. Один из участников системы НПИ берет на себя функции координатора доступа к соответствующему ресурсу и организации консорциума.  Возможно также привлечение НЭИКОН. Первоочередными отечественными внешними источниками для системы НПИ  являются;

Перечень зарубежных источников, необходимых для системы НПИ, должен быть определен дополнительно
      Распределение функций основных участников системы
В настоящем разделе излагаются принципы, по которым можно было бы распределить усилия по созданию открытых архивов и  коллекций первичных ресурсов  в системе НПИ, по крайней мере,  среди основных участников. Эти принципы, естественно, будут скорректированы в процессе создания системы.
НПБ – сосредоточивает свои усилия  на создании  электронных коллекций на основе имеющихся у нее традиционных фондов и получения обязательного электронного экземпляра от институтов РАО:

ИНИМ  (совместно с порталом РАО) сосредоточивает свои усилия на  создании  коллекций, используемых для оценки результатов научно-технической деятельности (РНТД)  в сфере педагогики и психологии:

ГНИИ ИТТ «Информика» сосредоточивается на ведении массивов и коллекций  образовательных ресурсов, на основе имеющихся  в составе системы образовательных порталов

Вторичные ресурсы системы НПИ
Самостоятельной проблемой является организация системы вторичных ресурсов  для всего пространства НПИ, Один из вариантов – это создание  единого распределенного каталога всех документов системы НПИ, который должен объединять вторичные ресурсы из всех  существующих и вновь создаваемых источников системы НПИ (включая каталоги образовательных порталов,  каталоги НПБ и Научного архива РАО, каталоги БД внешних источников и др.).  Сводный каталог системы НПИ должен быть  открытым и общедоступным.   Его создание и функционирование на основе технологии OAI требует дополнительных исследований. В частности, пока неясно, должен ли он распространяться   только на документы, доступные в коллекциях OAI  или иметь более широкий характер. Также неясно, возможно ли с разумными затратами решить проблему устранения дублирования в записях сводного каталога.
В любом случае, очевидно, что нынешняя система  распределенной каталогизации НПИ крайне неэффективна, и участники системы в значительной степени дублируют функции друг друга.
Однако, кроме сводного каталога,  могут быть весьма полезны и востребованы  вторичные ресурсы (каталоги, библиографические указатели,  справочно-поисковые указатели), предназначенные для  поиска в отдельных коллекциях, особенно специфических по виду источника или системе хранения.. Далеко не всегда целесообразно централизовать эти ресурсы в рамках единого сводного каталога.
Например, самостоятельными задачами является создание  поискового аппарата для Научного архива РАО,  библиографических указателей  по педагогической периодике, библиографических БД по диссертациям и авторефератам диссертаций, сведений о мероприятиях, реестра организаций и др.
Одним из основных факторов, влияющих на целесообразность унификации и централизации работ по созданию вторичных ресурсов, является  разнообразие средств метаданных и лингвистического обеспечения в  функционирующих в настоящее время ресурсах системы НПИ. Нужно  также учитывать привычку к этим средствам значительных категорий пользователей. Подробнее об этом сказано ниже.
Другим фактором, не менее существенным, является структура информационных потребностей пользователей  НПИ, их дифференциация относительно видов информационных источников и  систем доступа к информации.
Метаданные и средства  лингвистического обеспечения  системы НПИ
Имеющиеся ресурсы НПИ используют   разные стандарты  метаданных:  МЕКОФ, MARC, LOM,  а также  разные классификации:  УДК, ББК, ГРНТИ. В то же время основным требованием технологии OAI является использование  единой системы метаданных  в рамках протокола OAI-PMH.
Исходное состояние метаданных и лингвистического обеспечения  практически однозначно диктует следующие решения.
Дублинское ядро в некотором минимальном варианте  будет единым средством организации метаданных. Для действующих коллекций можно будет использовать конвертеры, причем из форматов MARC  и RUSLOM в формат Дублинского ядра они уже давно разработаны.
ГРНТИ – непосредственно или через таблицы соответствия – будет основным языком тематического поиска и тематического структурирования коллекций. Для коллекций, в которых  использование иной тематической классификации является принципиальным (примером может служить Единая коллекция ЦОР, где необходима классификация школьных предметов), используется  эта иная классификация, и  тематический поиск в этой классификации осуществляется с переходом на локальный классификатор. Для некоторых коллекций, например авторефератов и  полных текстов диссертаций, использование ГРНТИ целесообразно параллельно с  классификацией ВАК.
Для некоторых коллекций в качестве единого нормативного словаря (авторитетного файла)  для нормированного лексического (понятийного) поиска можно применять Тезаурус  по педагогике и психологии.  Именно так предполагается организовать сквозной тематический поиск  в Электронном каталоге  НПБ и справочно-поисковом аппарате Научного архива РАО.
Таким образом, для системы НПИ   могут применяться следующие лингвистические средства;
Для атрибутного поиска
Средства Дублинского ядра -  для поиска по всем архивам и коллекциям,  полные средства МАРК и RUSLOM – для некоторых коллекций.
Для тематического поиска
ГРНТИ  - для поиска по всем коллекциям (возможно, с небольшими исключениями). Другие классификации – для поиска по отдельным коллекциям.
 Для  лексического поиска
Свободная лексика – для поиска по всем коллекциям. Тезаурус и некоторые другие словари и авторитетные файлы – для поиска по отдельным коллекциям.
 Организационная модель системы  НПИ
Координирующим  и совещательным органом  системы НПИ является Межведомственный совет по информационным ресурсам образовательной сферы при НПБ им. К.Д. Ушинского РАО.  Состав Совета утверждается Президентом РАО. В состав Совета по должности входят  ответственные представители НПБ, ИНИМ и ГНИИ ИТТ «Информика».
Функции  Совета определяются Положением о Совете, также утверждаемом Президентом РАО. Решения Совета, имеющие организационно-экономический характер, подлежат утверждению руководством РАО и Рособразования.
Функцию оперативного управления системой выполняют НПБ им. К.Д. Ушинского, ИНИМ и ГНИИ ИТТ «Информика», распределяющие между собой на основе консенсуса конкретные функции администрирования системой, включая:

Отдельные функции администрирования системой могут быть переданы по взаимному соглашению администрации системы Соционет.

 

 

-----------------------------------------

1 Ханнанов Н.К. Аналитический отчет «Базы данных в области педагогических, психологических и смежных с ним наук: современное состояние.» ЧастьI, 3 п.л. ИНИМ, 2008

2 http://socionet.ru/.  

3 http://ct.eurocris.org/CRIS2006/