Информационное обеспечение науки. Новые технологии

АНАЛИЗ И ОЦЕНКА ОСНОВНОГО ПОТОКА СЕРИАЛЬНЫХ ИЗДАНИЙ РОССИИ ПО ТОЧНЫМ, ЕСТЕСТВЕННЫМ И ТЕХНИЧЕСКИМ НАУКАМ

Кириллова О.В., Андронова М.Б., Батюшко А.А., Березин А.Г.,
Дивильковская Т.Ю., Зеленина Г.З., Чернобровская Т.Н., Шапкин А.В.
(Всероссийский институт научной и технической информации РАН)

 

В течение ряда последних лет остается неизменной тенденция к увеличению издательского потока сериальных (периодических и продолжающихся) изданий России. Однако это отнюдь не означает улучшение его качественного состава. Простота публикации, отсутствие строгих требований и критериев при подготовке изданий, выпускаемых, как правило, малыми тиражами большим числом малых и средних издающих организаций, ведет к увеличению числа новых названий, в том числе, по естественным и техническим наукам.

Общая количественная картина динамики потока отечественных сериальных изданий за 10 и за 20 лет показана на рис.1 и в табл.1.

Таблица 1

Динамика выпуска периодических и продолжающихся за 20 лет

( с 1980 по 2001 гг.)

Виды изданий, назв.

1980

1986

1990

1995

2001

Периодические издания (журналы)

3960

(вкл. продол.)

1553

3681

(вкл. продол.)

1544

3316

Продолжающиеся издания (сборники, бюллетени)

3645

927

823

 

Рис. 1. Динамика роста числа отечественных журналов за 10 лет

 

Следуя официальной статистике [1], ежегодный прирост журналов России по названиям составляет в среднем 8%. Более 70% из них - специальные и специализированные журналы, в т.ч. 50% - научные и научно-производственные, примерно 8% - информационные. То есть, из 3300 периодических изданий, учтенных РКП в 2001 г., научные и научно-производственные журналы составляют примерно 1,6-1,7 тыс. названий. По совокупности данных объем потока периодических и продолжающихся изданий составляет более 4 тыс. названий (28 тыс. экземпляров). Из них периодических изданий – 2,2 тыс. названий. Продолжающиеся и периодические издания по естественным, техническим наукам, сельскому хозяйству и медицине составляют примерно 2,5 тыс. названий, из них журналов – 1,8 тыс. названий.

В то же время в условиях бурного развития новых информационных технологий, позволяющих создавать различные информационные продукты, в том числе по русскоязычным ресурсам, очень остро стоит вопрос об отборе из-за все увеличивающегося потока основной его части, которая характеризовалась бы наибольшей стабильностью выпуска, научной и технической ценностью и качественными издательскими показателями. Определение и выделение такого потока имеет большое значение для подготовки таких информационных продуктов, как реферативные издания и базы данных, полнотекстовые базы данных и электронные библиотеки, а также для такого нового для России информационного продукта, как “Российский указатель научного цитирования”, создание которого активно обсуждается в настоящее время научным сообществом.

ВИНИТИ РАН, как национальный научный центр, в недалеком прошлом стремился к формированию потока отечественных сериальных изданий с исчерпывающей полнотой, априори предполагая, что выпускаемые издания по тематике информационных продуктов ВИНИТИ всегда достойны того, чтобы постатейно быть отраженными в РЖ и БД ВИНИТИ. Однако исследования входного потока сериальных изданий, проводящиеся в последние годы в ВИНИТИ, показали, что это далеко не так: входной поток сериальных изданий России для целей подготовки информационных продуктов, предназначенных для научного сообщества, требует очень тщательного изучения и дифференцированного подхода к отбору изданий в такие системы. Поэтому перед ВИНИТИ стоит задача выбора из всего возрастающего отечественного потока периодических и продолжающихся изданий наиболее ценной, научно обоснованной, достоверной и актуальной информации.

В 2004-2005 гг. во входном потоке ВИНИТИ как сериальные издания было зарегистрировано 4532 назв. В то же время значительная часть из этих изданий, ранее отнесенных к продолжающимся (1389 назв.), в этот период были переведены в массив изданий книжного типа (см. ниже). В результате на данный момент (июнь 2005 г.) массив сериальных изданий включает 2242 назв. периодических изданий, поступивших в 2004-2005 гг. (из них 1765 назв. после проведенной работы по качественному анализу и экспертизе сохранены в “активном” состоянии), а также 901 назв. продолжающихся изданий (786 назв. - в “активном” состоянии).

Такой объем поступлений близок к официальным показателям и демонстрирует достаточную полноту поступления этого вида документов. В то же время он может быть также оценен как избыточный, содержащий достаточное число малоинтересных изданий. Так, например, за 5 месяцев 2005 г. 160 вып. 105-ти названий российских сериальных изданий, поступивших в технологию (“разметку”) для подготовки Реферативного журнала и Базы данных (РЖ/БД) ВИНИТИ, были исключены из обработки полностью как не соответствующие требованиям. Всего в технологию поступило 283 выпуска этих названий. Таким образом, дальнейшие шаги по анализу этих изданий предполагают их исследование на предмет исключения из входного потока ВИНИТИ.

Одновременно с этим существует вероятность отсутствия в потоке важнейших журналов, необходимых для отражения в информационных продуктах (ИП) ВИНИТИ. Анализ изданий, поступающих в РКП в меньшем количестве, показывает, что перечень изданий, находящихся в поле интересов ВИНИТИ, в 2004-2005 гг. составил 430 названий. ВИНИТИ, имея 14-й номер обязательного экземпляра, эти издания не получает. Причем 186 названий из них издается в Москве, 59 – в Санкт-Петербурге, остальные 185 выпускаются в регионах России (67 городов). По качеству же этого потока можно снова сказать, что лишь незначительное число этих изданий представляют существенный научный интерес. После анализа этого перечня ВИНИТИ оформил подписку или договора с редакциями только примерно на 70 названий. Около 120-130 названий требуют еще проведения экспертизы, причем значительная доля из них (примерно 50) – издания вузов (вестники и известия). Около 30-ти изданий из этого списка исключены из технологической обработки в 2004-2005 гг. как не представляющие интереса. Всего за 2004-2005 г. “закрыты для обработки” более 430 названий сериальных изданий.

На основании опыта работы ВИНИТИ с потоком сериальных изданий был выработан комплексный подход, позволяющий выделить основной поток изданий. Описываемый подход предполагает также использование в качестве дополнительной информации, а также для сравнения, данные других систем, как отечественных (например, перечень изданий, подготовленный ВАК Минобразования и науки), так и зарубежных, использующих российские издания (например, SCOPUS, CAS, INSPEC, SCI). Хотя последние придают только “вес” отдельным изданиям, но никак не влияют на полноту списка. Кроме того, зарубежные БД также дают представление о степени отражения русскоязычных и англоязычных версий журналов.

Таким образом, при выделении перечня основных российских сериальных изданий используются следующие блоки данных:

  1. научные журналы РАН (более 200 названий, около 1300 номеров в год), в т.ч. издательством “Наука” выпускается 155 журналов (119 – естественнонаучные и технические), из них 133 – в Москве, 22 – в Санкт-Петербурге, региональные (более 20 журналов), учрежденческие (около 30 журналов издаются отделениями и/или институтами РАН или самостоятельными редакциями);

  2. журналы с “импакт-фактором” (ИФ) Института научной информации США (в значительной степени – это журналы РАН, большинство из них получили этот показатель благодаря наличию англоязычной версии);

  3. журналы, получившие статистическую оценку (“суммарный коэффициент”) отражения в информационных изданиях России и зарубежья (достаточно высокую оценку также получают журналы, имеющие англоязычную версию). Из более чем 3-х тысяч российских периодических изданий, включенных в Ulrich’s в 2002 г, такую оценку получили 440 журналов по политематическому спектру, охватываемому ВИНИТИ [2];

  4. сериальные издания, включенные в перечень ВАК. Эти данные используются в качестве сравнительной характеристики и не могут, к сожалению, “придать ценности” всем изданиям, включенным в этот список в силу его значительной разнородности и неоднозначности;

  5. сериальные издания, отражаемые в государственной библиографии РКП. Этот перечень используется для выявления полноты поступления изданий в ВИНИТИ, хотя он также не является исчерпывающим.

Приведенные показатели можно отнести к категории внешних, которые необходимо учесть при формировании рекомендуемого перечня изданий.

Остальные предлагаемые оценки базируются на анализе имеющегося входного потока ВИНИТИ и распространяются на сериальные издания, которые проходили технологическую обработку в ВИНИТИ в течение достаточно длительного времени (от двух до четырех лет).

Накапливаемые со временем статистические данные по отражению сериальных изданий в ИП ВИНИТИ являются основополагающими для формирования их оптимального перечня. При этом учитываются также промежуточные статистические данные технологических процессов обработки изданий для ИП ВИНИТИ.

Обработка научно-технической литературы (НТЛ) в ВИНИТИ для подготовки РЖ/БД имеет отработанную на протяжении десятилетий технологию, включающую определенные производственные процессы и операции. Новые издания, прошедшие учет и регистрацию, поступают на участок “разметки”. На данном этапе производится определение тематического соответствия постатейного содержания журналов (и других видов изданий) “Рубрикатору информационных изданий ВИНИТИ”, на основе чего материалы направляются в соответствующие тематические редакции, подготавливающие реферативную информацию для РЖ/БД. Статьи, не соответствующие требованиям тематической разметки, не направляются на реферирование и не отражаются в ИП ВИНИТИ. Показатель постатейной “размечаемости” журналов (число статей, отобранных из выпуска для обработки) определяет степень их профильности для ИП ВИНИТИ. Определено 4 степени профильности для сериальных изданий, поступающих во входной поток ВИНИТИ:

  • “ядерные” (принадлежность издания к центральной зоне (“ядру”) журналов по конкретному тематическому направлению);

  • “профильные” (издания, имеющие непосредственное отношение к конкретной тематике);

  • “факультативные” (имеющие смежный характер статей по тематике, отражаются выборочно);

  • “непрофильные” (“не размечаемые”) издания.

Одна статья может быть “размечена” в нескольких тематических разделах. Соответственно, журнал может быть “ядерным” или “профильным” для нескольких тематических направлений ИП ВИНИТИ. Регулярная “неразмечаемость” является признаком несоответствия поступившего издания требованиям, предъявляемым для НТЛ с целью отражения в ИП ВИНИТИ.

Разработанная в ВИНИТИ Автоматизированная система комплектования, учета и регистрации входного потока НТЛ – АСКР, или АС “ВХОД”, позволяет получать различные статистические (отчетные) данные по результатам “прохождения” изданий в системе. Отчеты о результатах разметки позволяют получить данные о не размечаемых изданиях (“нулевых” экземплярах изданий) и на основе этого принимать решения об исключении изданий из входного потока ВИНИТИ.

Отчеты АС “Вход” позволяют получать статистические данные о разметке изданий в целом и в заданный при формировании отчета период времени. Эти отчеты дают возможность определить наиболее полно размечаемые журналы. Статистика отобранных на реферирование статей из журналов по результатам разметки является также показателем ценности изданий для ИП ВИНИТИ. Этот показатель можно назвать первичной оценкой статей из журналов в технологическом процессе подготовки ИП ВИНИТИ.

В то же время данные о разметке изданий не дают точной картины о полноте отражения их в ИП ВИНИТИ. Подход, применяемый при разметке, который основан на формальном определении тематики статей по Рубрикатору ИП ВИНИТИ, не учитывает других (содержательных) требований, которые предъявляют к статьям тематические редакции (отделы научной информации), принимающие статьи из входного потока на реферирование. Основные сведения, определяющие в итоге важность журналов для ИП ВИНИТИ, дает статистика отражения статей из журналов в ИП ВИНИТИ, в частности, в базах данных (вторичная оценка статей из журналов для ИП ВИНИТИ). Этот показатель можно условно определить как показатель “информационной продуктивности” издания в ИП ВИНИТИ. Условность определения этого показателя в виде среднего числа отраженных из выпуска статей выражается в том, что для истинного определения “информационной продуктивности” журнала в ИП ВИНИТИ необходимо учитывать также его “издательскую продуктивность”, выражающуюся в среднем числе статей в одном выпуске или в годовом комплекте (статейный объем издания). В таком случае продуктивность издания в ИП ВИНИТИ можно вычислить в виде коэффициента, получаемого по следующей формуле:


КPinf = Pip / Pizd

где КPinf -коэффициент продуктивности издания в ИП ВИНИТИ;

Рip - среднее число статей из одного выпуска журнала (или годового комплекта), отраженных в ИП ВИНИТИ;

Pizd – среднее число статей, публикуемых в одном выпуске (или годовом комплекте) журнала.

Рip для вычисления коэффициента информационной продуктивности в данном случае рассматривается как факт отражения статьи в ИП ВИНИТИ без учета дублирования рефератов в различных тематических разделах (то есть одна статья всегда будет учтена один раз независимо от числа рефератов на нее, размещенных в различных тематических выпусках РЖ и БД).

Для вычисления коэффициента информационной продуктивности необходимы точные данные об издательской продуктивности журналов. Такая работа начата, однако она требует дополнительных временных затрат, поэтому на данном этапе считается достаточным учесть в качестве информационной продуктивности среднее число статей из выпусков, отраженных в ИП ВИНИТИ за определенный период времени (не менее года).

В 2001 году в ВИНИТИ принята система, предусматривающая однократное (одноразовое) реферирование статей в основной редакции и многократное использование подготовленного реферата другими редакциями. Таким образом, на статьи, имеющие многоотраслевой (смежный) характер и включающие научный материал, представляющий интерес для нескольких редакций, составляется один реферат, который по данным тематической разметки направляется в редакции для рассмотрения и включения его в свои выпуски РЖ/БД. Данные о числе заимствованных рефератов (среднее число статей с учетом заимствования) имеют существенное значение для ВИНИТИ, как политематического информационного центра, так как позволяют проследить и выявить журналы многопрофильного плана, которые удовлетворяют интересам нескольких тематических редакций.

Для проведения вторичной оценки сериальных изданий (то есть оценки изданий по результатам отражения статей в РЖ/БД ВИНИТИ) в 2002 году построена специализированная подсистема статистической обработки, которая базируется на общем информационном поле с упоминавшейся выше АС “Вход”. Описания сериальных изданий в целом и их отдельных выпусков содержатся в “Массиве описаний сериальных изданий” и в “Каталоге поступлений ВИНИТИ”. Каталог поступлений отражает результаты учета и регистрации входного потока НТЛ в ВИНИТИ.

В 2003 году в ВИНИТИ разработана программа получения статистических данных по приведенным выше показателям, которая позволяет сформировать массив периодических и продолжающихся изданий, нашедших отражение в РЖ/БД за определенный период времени. На основе созданного статистического массива, отражающего продуктивность изданий для РЖ/БД, имеется возможность получать различные варианты перечней (отчетов) по изданиям для их дальнейшего анализа. Отчеты формируются по отдельным странам, по группам стран, по видам изданий (периодические или продолжающиеся издания) и т.п. В запросах также предусматриваются форматы выдачи информации, определяющие параметры, включаемые в отчеты. Отчеты могут быть представлены в виде текстовых файлов, в формате Excel и в распечатке.

При оценке важности журнала для РЖ/БД ВИНИТИ имеют значение также другие формальные и неформальные показатели (критерии), характеризующие выходные данные журнала, а также характер и структуру представляемого статейного материала.

В крупнейших зарубежных информационных центрах – аналогах ВИНИТИ – при оценке журналов, включаемых во входной поток для отражения в информационных продуктах, учитывается значительный набор критериев. Например, в ISI для отбора журналов в Current Contents учитывается не менее 20 показателей. Важнейшими из них, кроме указанных выше, являются: авторитетность издательства; продолжительность (стабильность) жизни издания; состав редколлегии; практика цитирования (наличие пристатейных списков); наличие предварительного рецензирования статей; адреса авторов (наличие и полнота); наличие рефератов-резюме; своевременность выпуска журнала (отсутствие задержек в сроках выпуска); периодичность (соответствие объявленной периодичности); формат оглавления, типы (характер) статей [3].

В настоящее время трудно принять к рассмотрению все перечисленные показатели при отборе российских периодических изданий. В этом случае значительная часть журналов не выдержит столь многосторонней экспертизы. Поэтому из перечисленных критериев была выбрана часть формальных показателей, дающих дополнительную информацию об издании и позволяющих получить их более полную характеристику. К таким показателям были отнесены: характер (тип) издания по целевому назначению, наличие резюме, год основания. Наличие резюме имеет также значение при разработке новой технологии электронной обработки российских периодических изданий, внедряемой в настоящее в ВИНИТИ.

При формировании перечня были также учтены сведения о журналах, вошедших в список, составленный на основе запросов действительных членов РАН, являющихся пользователями Системы информационного обслуживания (СИО) “Наука”, действующей в ВИНИТИ.

При изучении всего поступающего потока по целевому назначению стало понятно, что издающие организации и редакции достаточно произвольно определяют характер своих изданий. Было получено более 20-ти определений типа (характера) издания (здесь имеются в виду, в основном, периодические издания). Однако после всех проведенных оценочных действий над полученными предварительными списками журналов в “Перечень основных российских научных периодических изданий России” были включены журналы, определенные, в основном, как “научные”, “научно-теоретические”, “научно-технические”, “научно-производственные” и “массово-производственные”. При этом специального отбора журналов по этому критерию не проводилось. Все другие типы журналов были исключены из перечня в результате применения предложенного подхода.

Составление перечня основных периодических и продолжающихся изданий по точным, естественным и техническим наукам является достаточно сложным процессом, который, кроме статистической части работы, требует также дополнительной экспертизы изданий. Это, прежде всего, относится к изданиям, имеющим низкую “издательскую продуктивность”, т.е. незначительное число статей в выпуске, от одной до трех-пяти статей. К таким продолжающимся изданиям, прежде всего, относятся препринты научных организаций, поэтому этот вид изданий из рассмотрения исключается априори.

При составлении перечня, для удобства анализа, периодические и продолжающиеся издания рассматривались двумя различными списками, хотя в некоторых случаях определение статуса “продолжающегося” или “периодического” издания является условным, т.к. определяется по тому, насколько регулярным является выпуск издания. Если в течение 2-3-х лет издание, не имеющее редакционного сообщения о периодичности, поступает с постоянным числом выпусков (номеров) в год, оно относится к периодическим изданиям. Кроме того, в настоящее время выпускается значительное число изданий, которые имеют тематическое название, нумерацию выпусков, но, как часто бывает, в течение ряда лет, после одного-двух выпусков, прекращает свое существование, либо не издаются в течение ряда лет. В 2004-2005 гг. был проведен анализ массива сериальных изданий на предмет наличия таких изданий. В результате было выявлено большое число изданий, присутствующих в массиве одним-двумя числом выпусков. Для чистоты массива было принято решение о переводе изданий с тематическими названиями, выходящими нерегулярно, из массива сериальных изданий в массив изданий книжного типа (каталог книг). Таким образом, к продолжающимся изданиям (при наличии нерегулярности выпуска) было решено относить издания, имеющие в названии слова “бюллетень”, “вестник”, “доклады”, “известия”, “препринты”, “ученые записки” и “труды”, не имеющие тематического названия томов. Поэтому при получении статистических данных 2004 года по “разметке” показатели числа “размеченных” выпусков и числа “размеченных” статей продолжающихся изданий меньше, чем в 2003 году, т.е. эти данные не означают уменьшения потока этого вида изданий (см. табл. 3)

Ниже (табл. 2,3) приводятся основные количественные характеристики периодических и продолжающихся изданий, отдельно для каждого вида изданий. При составлении “Перечня основных периодических и продолжающихся изданий” два списка сливаются в один. Списки содержат издания, получившие формальную статистическую оценку по данным “разметки” 2003-2004 гг. и отражения в РЖ/БД 2004 гг. не менее 10. Однако, как уже было сказано, это не исключает дополнения списков другими изданиями, не вошедшими в рассмотрение из-за низкой “издательской продуктивности” или в результате не комплектности поступления. Кроме того, эти списки должны быть подвергнуты анализу на “прекращение”, особенно это касается тех периодических изданий, которые поступали в 2003 г. и отсутствуют в 2004 г. (около 200 названий).

Характеристика анализируемого массива периодических изданий

Массив составлен из журналов, вошедших в РЖ/БД ВИНИТИ 2004 года хотя бы одной статьей. Всего названий – 1964. В результате анализа предварительно в перечень основных периодических изданий было отобрано 1600 назв. В то же время, окончательный список может быть составлен только после интеллектуальной обработки как данного списка, так и списка изданий, исключенного из него. Это означает, что часть изданий с низкими показателями по какому-либо из перечисленных трех основных групп характеристик (разметка 2003, 2004 гг., отражение в 2004 г.) будут подвергнуты дальнейшему анализу также, как издания, исключенные из перечня.

Таблица 2

Общая характеристика анализируемого потока периодических изданий

Характеристика разметки 2003 г.

Характеристика разметки 2004 г.

Характеристика отражения в РЖ/БД 2004 г.

Размечено назв.

Размечено вып.

Размечено статей

Размечено назв.

Размечено вып.

Размечено статей

Отражено назв.

Отражено вып.

Отражено статей

1591

10079

111254

1672

9877

108298

1762

16549

94112

Среднее число статей на выпуск:

по данным разметки 2003 г. и 2004 г. – 11 статей/вып.;

по данным отражения в РЖ/БД – 5,7 статей/вып.

По 1 выпуску из названия было:

размечено в 2003 г. – 161 назв.

размечено в 2004 г. – 201 назв.

отражено в 2004 г. – 226 назв.

По периодичности анализируемой поток распределяется следующим образом (по убыванию):

4 вып./год – 618 назв.; 12 вып./год – 582 назв.; 6 вып./год – 517 назв.; 2 вып./год – 96 назв.; 8 вып./год – 34 назв.; 1 вып./год – 31 назв.; 10 вып./год – 28 назв.; 24 вып./год – 16 назв.; 3 вып./год – 15 назв.

Остальные 26 названий имеют периодичность от 52 до 5-ти. Одно название имеет 144 выпуска в год.

Таким образом, более 87% журналов имеют три основных принятых характеристики регулярности издания – 4, 6 и 12 вып./год, с, примерно, одинаковым распределением.

Выделенные качественные характеристики:

Имеют “импакт-фактор” - 20 назв.

Имеют “суммарный коэффициент” (методика ВИНИТИ [2]) – 363 назв.

Включены в список журналов, находящихся в сфере интересов действительных членов РАН – 82 назв.

Характеристика анализируемого массива продолжающихся изданий.

Всего в число продолжающихся изданий, отраженных хотя бы одной статьей в РЖ/БД 2004 г. вошло 2153 назв. российских и зарубежных изданий, из них российских изданий– 1143 назв., т.е. более 50%.

Таблица 3

Общая характеристика анализируемого потока продолжающихся изданий

Характеристика разметки 2003 г.

Характеристика разметки 2004 г.

Характеристика отражения в РЖ/БД 2004 г.

Размечено назв.

Размечено вып.

Размечено статей

Размечено назв.

Размечено вып.

Размечено статей

Отражено назв.

Отражено вып.

Отражено статей

691

2457

19666

702

1824

16939

954

2842

16891

Среднее число статей на выпуск:

по данным разметки 2003 г. – 8 статей/вып.;

по данным разметки 2004 г. – 9,3 статей/вып.;

по данным отражения в РЖ/БД – 5,8 статей/вып.

По 1 выпуску из названия было:

размечено в 2003 г. – 354 назв.;

размечено в 2004 г. – 410 назв.;

отражено в 2004 г. – 460 назв.

Из приведенных данных видно, что более 50% продолжающихся изданий вошли во входной поток ВИНИТИ всего одним выпуском.

В результате анализа предварительно в перечень основных продолжающихся изданий было отобрано 673 назв., которые также нуждаются в дальнейшей экспертной оценке.

Таким образом, общее число сериальных изданий, предназначенных для включения в список основных изданий, составляет более или около 2000 названий.

Отдельный анализ этого перечня основных периодических и продолжающихся изданий проводится в сравнении с перечнем изданий, подготовленным ВАК и включающим 994 названий. Данные сведения будут представлены позднее.

ЛИТЕРАТУРА

1. Печать Российской Федерации в 2001 году. // Стат.сб. РКП. - М., 2002.

2. Алексеев В.М., Ефременкова В.М., Кириллова О.В., Хачко О.А., Черный А.И. Разработка и применение критериев оценки мирового потока научно-технических журналов с целью оптимизации комплектования фондов ВИНИТИ. // НТИ. Сер.1. – 2002. - № 12. –С. 23-26.

3. Маркусова В.А., Черный А.И. Информационная продукция и технология ее подготовки в Институте научной информации, США. // НТИ. Сер.1. – 1985. - № 12. – С.6-15.