ВОЗМОЖНОСТЬ ВЫЯВЛЕНИЯ
ПРИОРИТЕТНЫХ НАПРАВЛЕНИЙ
С ИСПОЛЬЗОВАНИЕМ
РУБРИКАТОРОВ
И СЛОВАРЕЙ БАЗ ДАННЫХ
В.М. Ефременкова, Н.В. Круковская,
Ф.С. Сировский
(ВИНИТИ, ИОХ РАН)
Сложные системы - вызов искусству исследователя
Лауреат Нобелевской премии Г. Хакен
Выявление приоритетных научных направлений и слежение за развитием работ в них - сложная интеллектуальная аналитическая задача. Одним из способов её решения является. анализ больших массивов вторичной научной информации, накопленной в ведущих базах данных (БД) мира: Chemical Abstracts (СА), INSPEC, ВИНИТИ, SCISEARCH, INPADOC.
В данной работе предлагается метод получения информации о возникновении и развитии приоритетных направлений, используя статистические характеристики распределения публикаций по кодам классификаторов баз данных в сочетании с анализом свободной или контролируемой лексики. В основе этого метода лежит анализ динамики наполнения кодов классификатора верхнего уровня (второго или третьего), характеризующего определенное направление исследований. Рост количества публикаций в 3-5 раз в течение 3 лет может являться сигналом о возникновении нового направления в рассматриваемой области. Наличие нижних уровней классификации, если таковые имеются, дает более детальную информацию о тематике исследований. Точное определение нового направления может быть получено при анализе частоты встречаемости новых терминов или группы терминов в пределах выделенного кода классификатора. Подтверждением правильности сделанных выводов служит кривая роста количества публикаций в течение трех - пяти лет с момента обнаружения первой публикации (новое направление не всегда может быть сразу замечено, временной интервал иногда составляет более трех лет). Рост публикаций в 5 - 10 и более раз в течение трех лет свидетельствует о возникновении приоритетного направления в рассматриваемой области знания.
В качестве примера выбраны два приоритетных направления, на развитие которых во многих странах в настоящее время выделяются значительные средства. Это - искусственный интеллект и нанотехнологии. Анализ проводится с использованием иерархических рубрикаторов и предметных указателей БД СА, INSPEC и ВИНИТИ.
Искусственный интеллект. Примером достаточно точного совпадения наименований кодов рубрикатора с приоритетными направлениями может являться научное направление "Искусственный интеллект". Анализ динамики распределения потоков публикаций в рубриках "Искусственный интеллект" БД ВИНИТИ - 28.23 и БД INSPEC - С1230 выявил экспоненциальный рост публикаций с 1979 г. по 1988 г. Анализ частотности дескрипторов внутри рубрики С1230 (БД INSPEC) показал, что основным направлением работ в этот период времени были экспертные системы - 28.6%; системы организации знаний, куда относились и базы знаний - 21.8%; нейронные сети - 14.9%; интеллектуальные роботы - 10.1%; системы распознавания образов - 7.5%. Новым словосочетанием в 1982 г. оказался лишь термин "нейронные сети". Количество публикаций с этим термином выросло в 30 раз с 1985 г. по 1987 г. (за 3 года!), что являлся свидетельством возникновения новой ветви науки. Но при этом, рост цитирования первой работы по нейронным сетям (Дж. Хопфилда) в тот же временной интервал составил 3,5 раза (БД SciSearch). Таким образом , уже в 1987 г. можно было говорить о возникновении нового "прорыва" в научных исследованиях, которое впоследствии стало приоритетным.
В настоящее время в БД отражается от 1 тыс. (СА) до 3-3,5 тыс. (ВИНИТИ, INSPEC) публикаций в год. Нейронные сети и нейрокомпьютеры, использующие нейроподобные структуры и нейронные модели, успешно используются для обработки научных экспериментов, решения оптимизационных задач и задач прогнозирования, классификации и управления в различных областях - физике, астрономии, химии, медицине, геологии, машиностроении, бизнесе и др., что хорошо прослеживается по распределению публикаций по 31 тематическому фрагменту политематической БД ВИНИТИ, из них на долю публикаций во фрагменте "Техническая кибернетика" приходится около 40%, "Вычислительные науки" - около 33%, "Биология", "Физика", "Химия", "Машиностроение" и "Науки о Земле" - в каждой около 1.3 - 1.4%.
Нанонаука и нанотехнологии. Интерес к исследованию нанообъектов резко возрос после выхода теоретических работ Р. Фейнмана (1959 г.). Однако начало экспериментальных исследований, давших толчок развитию "нанотехнологии" связано с изобретением электронных микроскопов (1981-1986 гг.). В настоящее время ежегодно публикуется более 3 тыс. печатных работ, проводится 30-50 конференций, в Internet можно найти более 100 достоверных веб-сайта. Но оценить объем информации по всему приоритетному направлению практически невозможно, что связано с неустоявшейся терминологией и наличием большого количества объектов нанонауки и нанотехнологии, в названии которых нет приставки "нано", хотя по размерным и другим характеристикам эти объекты относятся к рассматриваемому направлению. Примером таких объектов являются фуллерены и интеркалированные соединения. Фуллерены - полиэдрические кластеры углерода, описанные впервые Kroto H. et al. в 1985 г. Публикации по фуллеренам отражены в БД в нескольких рубриках. Например в CA это связано с тем, что, с одной стороны, в БД информация о них классифицируется по веществам (секция 78 "Неорганические вещества и реакции"), с другой стороны, по их физико-химическим свойствам (секция 65 "Общая физическая химия"). Новый термин "фуллерен" появился в 1985 г. в 78 секции. С 1990 по 1992 г. частотность употребления нового термина возрастает в 14 раз. С 1990 г. наблюдался экспоненциальный рост публикаций и за три последующих года количество работ увеличилось в 50 раз в секции 78 и в 75 раз в секции 65. Рост цитирования первой работы в БД SciSearch за тот же временной интервал составил 5 раз. .Таким образом, уже в 1992 г. можно было говорить о появлении нового научного фронта - фуллерены.
Один из интересных нанопроцессов - слияние малых фуллеренов с образованием углеродных нанотрубок. Родство фуллеренов и нанотрубок отражено в иерархическом тезаурусе.
=> e fullerenes+rt/ct
E1 6705 --> Fullerenes/CT
E2 4371 RT Nanotubes/CT
Углеродные нанотрубки были открыты в 1991 г. S. Iijima. В настоящее время это наиболее четко терминологически выделенное узко-тематическое направление работ в нанотехнологии, по которому отмечен резкий рост исследовательской активности с 1992 по 1994 гг. в 15 раз и продолжает расти столь же стремительно. В CA публикации по нанотрубкам рассеяны по многим секциям классификатора, но наибольшее количество относится к секции 76 "Электрические явления" - около 25%, в секциях 65 и 78 - около 10% в каждой, т.е. основное направление работ связано с электрическими свойствами нанотрубок. Как показал проведенный анализ, рост публикаций по нанотехнологии связан с рассмотреными направлениями исследования.
Таким образом, использование классификаторов БД ведущих мировых производителей в сочетании с анализом ключевых слов позволяет увидеть зарождение новых "ветвей" знания, которые в дальнейшем могут оказаться приоритетными направлениями развития науки.