Информационное обеспечение науки Новые технологии

Информационное обеспечение науки. Новые технологии

Схемы метаданных ЕНИП:
практика применения OWL в ЕНИП

Бездушный А.А. (Центр научных телекоммуникаций РАН),
Бездушный А.Н. (Вычислительный центр РАН),
Серебряков В.А. (Вычислительный центр РАН)

Работа посвящена схемам метаданных Единого Научного Информационного Пространства РАН, применение которых должно сыграть ключевую роль в обеспечении семантической интероперабельности в научной среде РАН, упрощении обмена и взаимодействия информационных систем, входящих в ЕНИП. В работе поясняются основные цели и принципы формирования модульных схем ЕНИП, применение языка OWL для описания схем. Даётся обзор базового набора схем ЕНИП, отвечающего за описание научной информации общего характера, а также упоминаются основные разработанные специализации, отвечающие более специфическим научным областям. Данная статья дает лишь краткий обзор предложений по метаданным ЕНИП, более подробная исчерпывающая информация и пояснение способа формирования RDF/XML-документов в соответствие со схемами ЕНИП приведены в издаваемом отдельно Руководстве по схемам метаданных ЕНИП.

Роль схем метаданных ЕНИП

Единое Научное Информационное Пространство РАН (ЕНИП РАН) – это инициатива, ставящая своей задачей интеграцию научных данных различных учреждений РАН и построение единой распределенной среды с целью обеспечения активных научных коммуникаций и эффективного использования научной информации, более эффективных средств поиска информации, сотрудничества и совместной работы. Подробнее о целях, задачах и средствах ЕНИП см. [1, 2].

Для формирования масштабной распределённой среды, интеграции многих независимых информационных систем, наилучшим вариантом проведения интеграции является обеспечение “свободного общения”, “взаимопонимания” этих систем – так называемой интероперабельности систем. Интероперабельность – это способность системы к взаимодействию с другими системами. Под этим понимается соблюдение определенных правил или привлечение дополнительных программных средств, обеспечивающих возможность взаимодействия независимо разработанных программных систем. Это своего рода стандарты, которым должны удовлетворять интегрируемые информационные системы.

Принято различать три уровня интероперабельности информационных систем – техническую, синтаксическую и семантическую, которым соответствуют транспортная среда, формат сообщений и смысл данных. В данной статье мы сфокусируемся на проблеме семантической интероперабельности. Это термин, появившийся сравнительно недавно, уже после того, как XML стал де-факто стандартом представления данных при обмене, что дало возможность гарантировать синтаксическую интероперабельность в Web и рассмотреть более сложные проблемы идентификации семантики, смысла данных помимо просто их структуры. Семантическая интероперабельность – это способность приложений понять смысл данных друг друга.

Данные могут относиться к различным предметным областям, в рамках одной иметь разные выражение и интерпретацию. Соответственно, для обеспечения семантической интероперабельности, во-первых, необходим некоторый механизм, позволяющий описать предметную область, указать, какие в ней используются термины и как они взаимосвязаны – схему данных. Таким общим механизмом является стек технологий Semantic Web: RDF, RDFS, OWL. В данной работе мы не будем подробно рассматривать эти технологии (см. спецификации [3,4]).

Во-вторых, необходим некоторый набор стандартов-схем метаданных, описывающих общепринятые понятия, которыми будут “общаться” интегрируемые системы. В рамках ЕНИП – это набор базовых схем для описания научной информации, такой как публикации и разработки, и пр. – “толковый словарь” для общения научных ИС. Именно этим схемам и посвящена данная статья. Дальнейшие разделы рассматривают состав предложений по формированию набора элементов метаданных ЕНИП и принципы структуризации элементов метаданных.

Лежащие в основе предложений ЕНИП стандарты и работы

В настоящее время заметна широкая тенденция по стандартизации RDF-словарей элементов метаданных для конкретных предметных областей – так называемых “обменных схем”. Использование терминов (свойств, словарей значений и пр.), зафиксированных в стандартах, позволяет приложениям легко интегрироваться между собой, обмениваться информацией, понятной им всем. Например, при получении данных из сторонней системы, приложение может найти среди неизвестных ему свойств некоторые свойства, регламентированные стандартом, и соответственно будет уверено в их смысле, семантике, сможет правильно их проинтерпретировать. Это и называется “семантической интероперабельностью”.

Dublin Core Metadata Initiative (DCMI) определил минимальный набор свойств для описания цифровых ресурсов Web, а также их детализацию в рамках “общего профиля” [6]. Отдельные рабочие группы DCMI занимаются стандартизацией более специализированных профилей метаданных таких предметных областей, как библиотечная информация [7], образование [8], правительственная сфера [9], информация о людях [10] и пр.

Dublin Core стал базисом для других “стандартов обмена”. В первую очередь, следует упомянуть стандарт Publishing Requirements for Industry Standard Metadata (PRISM) [11], разработанный издательскими организациями для обмена метаданными о публикациях (документах, журналах, книгах и пр.). Государственный архив Австралии выдвинул и стандартизовал основанный на Dublin Core набор профилей метаданных для описания государственной информации – AGLS Metadata Standard [12]. Заслуживают упоминания также проекты, делающие попытку спецификации схем для библиографической информации (BIBLINK [15], bibTeX [16]…), европейская инициатива по разработке схем для Math-Net [17], UKOLN RSLP CLD [18] профиль метаданных для описания цифровых коллекций и пр. Широкое применение нашли предложения по представлению информации стандарта VCard (“визитная карточка”) в RDF [13]. VCard определяет свойства для описания информации о людях, их контактной информации и пр. На описание информации о людях направлена также набирающая популярность открытая инициатива Friend of a Friend (FOAF) [14].

Помимо обменных “профилей метаданных”, существуют инициативы по построению “онтологий” предметных областей, нацеленных больше на спецификацию большого количества классов и их взаимоотношений, нежели словарей свойств для обмена. Среди них: KA2 - Knowledge Acquisition Community Ontology [20] и SWRC - Semantic Web Research Community Ontology [21]. Эти онтологии описывают персоналии, организации, проекты, публикации и пр. Из последних Semantic Web-разработок в этой области следует упомянуть онтологию портала Advanced Knowledge Technologies (AKT) - "AKTive Portal" [19].

При разработке предложений по наборам элементов метаданных ЕНИП мы провели детальный анализ всех упомянутых и других (daml.org, protege.stanford.edu,…) стандартов и предложений, а также анализ различных не-RDF ориентированных предложений по стандартизации метаданных (CERIF 2000 [22], CIDOC [23], MARC и RUSMARC и др.), различных отечественных и международных систем классификации ресурсов. Основные международные стандарты и предложения были непосредственно включены в предложения ЕНИП, в частности, Dublin Core, vCard, а также FOAF, UKOLN RSLP CLD.

Кроме того, мы основывались на нашем опыте в разработке и поддержке информационного портала РАН (http://www.ras.ru), а также нашем опыте в разработке информационных систем, в частности, портала научного института ВЦ РАН, включая субпорталы электронной библиотеки, каталога научной информации, библиотечного отдела [26], редакционно-издательского отдела, портала mathnet [27], системы ведения конференций [28] и портала научного института ПНЦ РАН, тематическому порталу “Сверхпроводимость”, системе каталогизации экспериментальных данных научных исследований ТОИ ДВО РАН [29], портала инновационной деятельности [24], электронной библиотеки диссертаций РГБ [25], информационного портала ГСНТИ, официального портала ВМиК МГУ (http://cmc.msu.ru) и пр.

Авторы статьи выражают благодарность нашим коллегам, участвовавшим в обсуждении и формировании предложений по схемам метаданных ЕНИП, в частности, Каленову Н.Е. (БЕН РАН), при существенной поддержке которого был сформирован профиль библиографической информации ЕНИП, Алексееву А.Н. (ИМСС УрО РАН), участвовавшему в обсуждении схемы описания конференций и предложившему схему поддержки проведения конференций, Аджиеву А.С. (ЦНТК РАН), предложившему схемы математической информации и тезаурусов, а также другим нашим коллегам, участвовавшим в обсуждении предложений ЕНИП.

Обзор состава предложений ЕНИП

Естественно, информационное наполнение Единого Научного Информационного Пространства на начальном этапе поддержки ЕНИП не может представлять всего разнообразия тематической специализации различных научных учреждений. Необходимо представить в первую очередь информацию, характеризующую основные аспекты научной деятельности. Соответственно, во-первых, должен быть выделен основной профиль метаданных ЕНИП, включающий общеприменимые и первоочередные предметные области, независимо от тематической специализации отраслей науки. Во-вторых, должен быть специфицирован механизм расширения стандарта дополнительными специализированными профилями, ориентированными на использование в специализированных научных сообществах, а также может быть предложен ряд наиболее существенных специализированных профилей.

В основной профиль можно выделить общую поддержку следующих четырех основных групп информационных сущностей:

“Участники научной деятельности” – центральное звено, вся информация в РАН связана с научной деятельностью её сотрудников, “Персон”, образующих разнообразные организационные объединения от формальных (“Организации” и “Подразделения”) до неформальных (“Коллективы”, “Сообщества”, “Рабочие группы”).
“Научная деятельность”, в частности, “Проекты”, отражающие процесс научной деятельности, информация о результатах проектов, патентах и т.п., а также “Научные мероприятия” – как разовые, так и повторяющиеся, такие как “Конференции”, “Семинары”, “Симпозиумы”.
“Результаты научной деятельности”, в которые могут входить “Интернет-системы” – Web-сайты и пр., “Базы данных”, предоставляющие автономные коллекции информации с той или иной степенью интеграции с ЕНИП и т.п., “Экспериментальные данные” и их “Математические модели”, “Программные системы”, в частности, “Научные вычислительные приложения”, “Экспериментальные установки”, “Изобретения”, “Технологии”, и т.п.
“Документы и публикации” – ресурсы этого типа представляют собой научные труды, статьи, отчёты сотрудников (научные “Публикации” и “Диссертации” сотрудников). Примерами специализации публикации могут служить, например, “Тезисы конференций” и т.п.

Основной профиль метаданных ЕНИП подробно описан далее в данной статье. Основной профиль опирается на выделяемые в отдельный профиль вспомогательные схемы, которые включают общую поддержку контролируемых словарей, классификаторов и тезаурусов; поддержку конкретных типов справочников: геополитических единиц и административно-территориального деления, национальных языков; общую поддержку контактной информации.

Помимо базового набора элементов метаданных, предложения ЕНИП включают ряд наиболее существенных специализированных/прикладных профилей метаданных; в настоящее время публикуются следующие специализации:

Библиографическая информация - представление метаданных об официально зарегистрированных печатных изданиях (публикациях).
Информация о разработках и продуктах – представление специфических метаданных, характерных для конкретных типов разработок, а не понятия разработки “в общем” (в частности, программное обеспечение, Web-сайты и системы, базы и наборы данных, техническое обеспечение и оборудование).
Математическая информация – поддержка специфики описания ресурсов, имеющих отношение к математике, в частности, поддержка специфических математических идентификаторов и представления математических формул в тексте описания ресурсов.
Конференции и поддержка проведения конференций – описание конференций, семинаров, симпозиумов и пр. подобных мероприятий, начиная с общего описания конференции, участников, трудов конференции, и далее специализируя это описание всеми данными, необходимыми для поддержки проведения конференций.
Коллекции и архивы – поддержка описания коллекций, объединений физических и/или электронных элементов. К этому профилю относятся архивы и цифровые архивы, библиотечные и музейные каталоги и коллекции, электронные коллекции текста, изображений, звуков, данных, программных продуктов и пр. (в частности, CD-диски, Web-подборки), разнообразные физические коллекции (картин и пр.), коллекции мероприятий (например, серии лекций).
Поддержка библиотечной деятельности – поддержка информации для межбиблиотечного обмена и библиотечной деятельности; расширяет библиографическую специализацию понятием единиц хранения изданий (экземпляров изданий), а также библиотечных сервисов.
Поддержка издательской деятельности – метаданные для описания плана издательства редакционно-издательского отдела организации; этот профиль может быть использован в качестве единого формата предоставления списка публикаций авторами и отделами организации в план издательства.

Структурная организация элементов метаданных ЕНИП

Предложения по наборам элементов метаданных ЕНИП являются развитием идей Dublin Core Metadata Initiative (DCMI) в направлении дальнейшей детализации наборов элементов метаданных в направлении различных предметных областей, имеющих отношение к научным исследованиям, с целью поддержки обмена как метаданными общего характера в рамках всего научного сообщества, так и более узкоспециализированными метаданными в рамках заинтересованных сообществ (например, библиотечного, математического, музейного сообщества).

В отличие от предложений Dublin Core Metadata Terms [6], которые содержат достаточно небольшой набор общих элементов метаданных, нацеленных в основе своей на описание web-документов, структура предложений ЕНИП охватывает существенно более широкий набор понятий и позволяет в зависимости от нужд приложения описывать их на существенно более высоком уровне детальности. Соответственно, встает задача структурной организации элементов метаданных ЕНИП, выделения отдельных профилей, специализаций, подсхем, уровней детальности описания. Текущие разработки дополнительных элементов метаданных DCMI [7,8,9,10] также нацелены на описание более конкретных предметных областей, соответственно, для них вводится понятие профилей приложений (Application Profiles), которые решают такую задачу в рамках предложений DCMI. Профиль приложения состоит из элементов, взятых из одной или нескольких схем стандартов, объявляющих термины, и собранных вместе для нужд конкретного приложения (в частности, конкретного сообщества). Профиль приложения позволяет определить, какие из элементов стандарта (или нескольких стандартов) нужны для решения задач данного приложения, то есть, как данное приложение использует стандарт.

Понятие профиля приложения в том виде, в каком оно рассматривается DCMI, пригодно, опять же, только для ограниченных наборов поверхностных метаданных общего характера, предлагаемых стандартами DCMI, и не затрагивает вопроса различных уровней поддержки детализации метаданных разными приложениями. Для предложений ЕНИП необходимо более развитое решение.

Кроме того, предложения DCMI не рассматривают онтологического аспекта описания метаданных – классов. DCMI определяет допустимые к применению поля (свойства) метаданных и варианты их значений, но не указывает типов ресурсов (классов), к которым эти относятся свойства, поскольку все предложения DCMI в большей мере нацелены лишь на описание web-документов, в наиболее широком смысле – на описание разработок/продуктов. DCMI не определяет, как описывать людей и организации, разного рода деятельность – проекты, мероприятия, и пр. Предложения ЕНИП затрагивают все эти и некоторые другие предметные области, и, соответственно, определяют не только свойства, но и классы метаданных.

Наконец, существующие предложения по представлению элементов Dublin Core в RDF/XML опираются лишь на понятия языка RDF Schema (RDFS [3]), с целью фиксации словарей элементов метаданных (свойств и типов значений), но не определяя ограничений на применение этих свойств, равно как и классов, к которым они относятся. Предложения ЕНИП затрагивают эти вопросы и другие аспекты построения онтологии каждой предметной области, а не просто спецификации набора терминов стандарта. Соответственно, для описания элементов метаданных ЕНИП используется подмножество языка описания Web-онтологий OWL [4].

Как следствие указанных требований, с целью структурной организации элементов метаданных ЕНИП вводится понятие “OWL-схемы блока ЕНИП”. Определение и описание всех элементов метаданных ЕНИП разбивается на отдельные схемы-фрагменты, каждая из которых вводит дополнительные понятия, либо уточняет понятия других схем.

Таким образом, элементы метаданных ЕНИП разбиваются на множество схем опциональных для поддержки в конкретных приложениях. Каждое приложение в ЕНИП может описать собственный профиль приложения, указывая набор поддерживаемых этим приложением схем, то есть, обеспечивается индивидуальный для каждого приложения уровень поддержки стандартов ЕНИП.

Элементы метаданных ЕНИП подразделяются на отдельные схемы по нескольким направлениям (рис. 1):

предметной области (как правило, описываемой сущности),
глубине детализации и специализациям данной предметной области,
а также общим для всех сущностей аспектам их описания.

Рис. 1. Способ структурной организации элементов метаданных ЕНИП

Последовательно расшифруем эти направления. Во-первых, различные информационные системы могут ориентироваться на различные предметные области. Например, одни имеют дело с научными публикациями, другие с проектами, третьи и с тем, и с другим. Соответственно, желательно иметь как минимум отдельную схему под каждую “минимальную предметную область”, чтобы тематически разделить элементы метаданных, а также предоставить каждому приложению возможность выбора набора необходимых ему предметных областей. Помимо содержательных предметных областей выделяются так называемые вспомогательные схемы, не несущие прямой смысловой нагрузки, но используемые в качестве необходимых элементов описания основных схем.

Наряду с выделением общих предметных областей, делается попытка определиться со стратегиями, методиками развития схем – наращивания уровней, глубины описания той или иной предметной области, подходящих для разных систем. Необходимо не просто предложить схему для той или иной сущности или научной области, но и для каждой из них предложить несколько “уровней поддержки” этой предметной области разными системами. Так, по полноте описания конкретной предметной области отдельные схемы ЕНИП, как правило, подразделяются на следующие уровни:

минимальная схема – необходимый разумный минимум, минимально достаточный для обмена метаданными, поддержки взаимосвязей ресурсов;
базовая схема – объем, достаточный для эффективного описания данных в системах, имеющих прямое отношение к данной предметной области;
расширенная схема – объем достаточный для основной работы специалистов данной предметной подобласти;

Дальнейшее наращивание глубины описания предметной области подразумевает переход к специализации предметной области, как правило, в нескольких направлениях. Термины, определяемые специализированными схемами, ориентированы в основном на обмен метаданными в рамках специализированных научных сообществ, на работу специалистов в данной отрасли. Например, поддержка библиографического описания публикаций, библиотечной деятельности, издательской деятельности - являются специализацией “минимальной предметной области” описания документов. Примером специализированной схемы является также поддержка специфики описания математической информации. Ещё примеры: поддержка проведения конференций является специализацией общего понятия конференции, поддержка детального описания конкретных типов разработок (программное обеспечение, веб-ресурсы, базы и наборы данных, оборудование) является специализацией общего понятия разработки (“продукта”).

Предметные области совместно с глубиной специализации формируют своего рода иерархическое измерение. Ортогональным к этому измерению является измерение возможных аспектов описания сущностей. Помимо основного “предметного” аспекта, в базовом наборе элементов метаданных ЕНИП выделяются следующие аспекты:

исторический аспект – сведения исторического характера, например, историческая справка о некоторой сущности, а также информация об уже не существующих в настоящее время сущностях, но существовавших ранее. Исторический аспект данных необходим в системах накопления информации, архивах, но не нужен системам, нацеленным на работу с исключительно актуальной информацией.
академический аспект – научные и организационные сведения, характерные для данного типа сущностей исключительно в контексте Академии Наук, например, принятые в РАН системы идентификации и рубрикации, информация о научных званиях и степенях, и пр.
официальный аспект – официальные реквизиты сущностей, такие как паспортная информация персон, официальные и банковские реквизиты организаций, государственные классификационные коды и пр.

Каждая сущность может характеризоваться собственным набором свойств, соответствующих конкретному аспекту, но, тем не менее, понятие аспекта независимо от типа сущности и, как правило, присуще всем типам сущностей, независимо от предметной области.

Подробнее механизмы организации модульных OWL-схем ЕНИП описаны в статье [1].

Основные понятия спецификации схемы в ЕНИП

Для понимания предложений по элементам научных метаданных ЕНИП существенно также вкратце пояснить основные понятия языка OWL, а также специфические понятия схем ЕНИП.

При описании схемы (онтологии) на OWL может определяться набор классов, набор свойств, а также может быть указан ряд утверждений об этих классах и свойствах, либо о классах и свойствах, определенных другими онтологиями. Следует отметить, что классы и свойства рассматриваются ортогонально: свойство определяется не в контексте класса, а независимо, и может быть использовано в различных классах.

Традиционно, одни классы могут быть подклассами других (например, “агент” – “персона”, “деятельность” – “проект”), в частности, допускается множественное наследование. Помимо этого, и для свойств есть понятие подсвойств. Подсвойство уточняет и специализирует смысл по сравнению с суперсвойством (например, свойство “участник” – подсвойства “руководитель”, “ответственное лицо”; свойство “название” – подсвойства “сокращенное название”, “официальное наименование”). На свойства могут быть указаны глобальные ограничения: его тип значений (примитивный тип XML Schema, либо объектный класс), область применения (класс, к которому относится это свойство, если указан), а также глобальные характеристики: обратное свойство, функциональность и пр. Помимо этого, в OWL возможно указание локальных ограничений на свойство в контексте некоторого класса: уточнение типа значений, мощности свойства (обязательность, допустимое количество значений) и пр.

Существенным для описания схем ЕНИП является также понятие контролируемых словарей – аналогов перечислимых типов XML Schema. Однако, в отличие от значений перечислимого типа, элементы контролируемого словаря являются полноценными ресурсами, имеющими собственные характеристики (такие как название, описание, а возможно и собственные поля), контролируемый словарь может быть расширяем, и пр. Кроме того, контролируемый словарь может быть организован иерархически, в таком случае он называется классификатором (рубрикатором), а также может быть организован в структуру тезауруса.

Основной профиль метаданных ЕНИП

Ниже приводится обзорное описание основного профиля схем метаданных ЕНИП. Детальное описание основного профиля, а также описание остальных схем и предложений ЕНИП, пояснение способа формирования RDF/XML-документов для обмена данными в соответствие со схемами ЕНИП и пр. - приведено в издаваемом Руководстве по схемам метаданных ЕНИП.

Предлагаемое обзорное описание структурировано следующим образом. В виде структурированного списка приводится определение основных классов, для каждого из которых приводится состав свойств данного класса и состав подклассов; аналогично описываются и подклассы. Следует учитывать, что каждый из подклассов наследует состав свойств, определенный в суперклассе. Также, для свойств, значением которых является подструктура, приведено описание состава полей подструктуры.

Описания классов и состава свойств разбиты на отдельные ЕНИП-схемы (указаны курсивом), в которых определяются данные классы или свойства, согласно описанной стратегии организации элементов метаданных ЕНИП. Так, схема описания действующего лица вводит понятие класса “Лицо” (субъект деятельности) и определяет ряд свойств этого класса. Минимальная подсхема описания организаций вводит понятие его подкласса “Организация”, минимальная подсхема описания персон вводит понятие подкласса “Персона”, далее базовые и расширенные схемы, а также схемы академического и исторического аспектов описания персон и организаций вводят дополнительные свойства к этим классам, и так далее.

Итак, основной профиль метаданных ЕНИП включает следующие схемы, классы и свойства:

Минимальная схема описания действующего лица:

Класс Лицо - Субъект деятельности (т.н. “агент”), то есть действующее лицо проектов и мероприятий, автор или участник разработок и публикаций. К этому классу относятся персоны, группы и коллективы, организационные единицы. Свойства класса:

Электронная почта* - Контактный адрес электронной почты.
Телефон* - Контактный телефон.
Другие контакты - Прочая контактная информация, которая не вошла в другие поля.
Web-адрес* - URL, в частности, HTTP-адрес контактной web-страницы, либо адрес FTP.

Базовая схема организаций:

Подкласс Организационная единица - Данный класс представляет организационные единицы (организации и подразделения), как частный случай действующего лица. Свойства класса:
- Название - Имя, сопоставленное ресурсу, обычно, под которым он официально известен.
- Сокращенное название - Сокращенное обозначение, как правило, аббревиатура.
- Описание - Текстовое описание ресурса.
- Адрес* - Полный почтовый адрес.
- Контактное лицо* - Контактное лицо в организации.
- Схема проезда - Описание проезда к организации, на конференцию, семинар и т.д.

Расширенная схема организаций:

Текущая деятельность - Описание текущей деятельности или тематики деятельности.
Предыдущий опыт - Описание предыдущего опыта в рассматриваемой области.
Ключевые слова - Классификация с помощью списка слов с разделителями (например, через запятую).
Логотип (подструктура: Файл данных) - Мультимедийное изображение, представляющее собой логотип персоны, коллектива, организации и т.п.
Фото (подструктура: Файл данных) - Мультимедийное изображение, представляющее собой фотографию персоны, коллектива, здания организации и т.п.
Дата основания - Дата основания организации или подразделения.

Академическая схема организации:

Рубрика РФФИ* (элемент классификатора: Рубрика РФФИ) - Элемент классификатора областей знаний РФФИ .
Специальность ВАК* (элемент классификатора: Специальность ВАК) - Рубрика классификатора специальностей ВАК.

Историческая схема организационных единиц:

Дата расформирования - Дата расформирования организации/подразделения. По наличию данной даты историческая информация отличается от актуальной.
Историческая справка - Историческая справка в произвольной форме.

Расширенная схема организаций:

Подкласс Организация - Организация в юридическом смысле (отличается от подразделения) как частный случай организационной единицы.

Свойства класса:

Подчиненная организация* (ссылка: Организация) - Организация, административно или иным способом подчиненная данной организации.
Вышестоящая организация* (ссылка: Организация) - Организация, которой административно или иным способом подчинена данная организация.

Схема описания структуры организации:

Тип организации (элемент классификатора: Тип организации) - Тип организации, ссылка на элемент словаря принятых в рассматриваемой предметной области типов организаций.
Подразделения* (ссылка: Подразделение) - Подразделения, входящие в состав данной организации.

Академическая схема организации:

Административно подчиненная организация* (ссылка: Организация)
Регионально подчиненная организация* (ссылка: Организация)
Подчиненная по научной линии организация* (ссылка: Организация)
Административно вышестоящая организация* (ссылка: Организация)
Регионально вышестоящая организация* (ссылка: Организация)
Вышестоящая по научной линии организация* (ссылка: Организация)

Схема описания структуры организации:

Подкласс Подразделение - Подразделение (орг. единица, являющаяся частью некой организации в юридическом смысле).

Свойства класса:

Организация (ссылка: Организация) - Организация, в состав которой входит подразделение.
Тип подразделения (элемент классификатора: Тип подразделения) - Тип подразделения, ссылка на элемент словаря принятых в рассматриваемой предметной области типов подразделений.
Подчиненное подразделение* (ссылка: Подразделение) - Подразделения, административно подчиненные данному подразделению.
Вышестоящее подразделение* (ссылка: Подразделение) - Подразделение, которому административно подчинено данное подразделение.

Схема штата организаций:

Сотрудники* (подструктура: Штатная должность) - Должности (штатные единицы) организационной единицы и занимающие их сотрудники. Поля подструктуры:

Общая схема должности:

Наименование должности - Наименование занимаемой указанным лицом должности. В зависимости от поддерживаемой глубины структуризации, задается либо строкой, либо ссылкой на элемент расширяемого словаря типов должностей.
Приоритет - Число, определяющее порядок вывода элементов. Чем меньше число, тем выше в списке находится данный элемент. При этом не накладывается требования нумеровать элементы сплошной последовательностью (1,2,3..), допустимо указывать приоритеты с пропуском (10,20,30...).
Должностное лицо (ссылка: Персона) - Лицо, занимающее данную должность.

Историческая схема должностей:

Дата вступления - Дата вступления данного должностного лица в указанную должность.
Дата снятия с должности - Дата снятия данного должностного лица с указанной должности (в частности, увольнения), либо расформирования должности. По наличию данной даты историческая информация отличается от актуальной. В случае снятия с должности и назначения на данную должность нового лица, указывается новая структура “Должность” с указанием нового должностного лица и даты вступления в должность (то есть, структура “Должность” заводится для каждого факта нахождения некоторого лица в некоторой должности).

Схема штата организаций:

Работодатель (ссылка: Организационная единица) - Организация или подразделение, к которому относится данная должность.
Электронная почта* - Контактный адрес электронной почты.
Телефон* - Контактный телефон.
Другие контакты - Прочая контактная информация, которая не вошла в другие поля.
Подразделение - Подразделение, к которому относится данная должность (если не может быть указано непосредственно по ссылке).
Web-адрес* - URL, в частности, HTTP-адрес контактной web-страницы, либо адрес FTP.

Поддержка контролируемого словаря штатных должностей:

Наименование должности (элемент словаря: Тип должности) - Наименование занимаемой указанным лицом должности. В зависимости от поддерживаемой глубины структуризации, задается либо строкой, либо ссылкой на элемент расширяемого словаря типов должностей.

Базовая схема описания персоны:

Подкласс Персона - Данный класс описывает метаинформацию о людях, как частном случае действующего лица. Свойства класса:
- Домашняя страница* - URL-адрес домашней страницы.
- ICQ* - Номер профиля пользователя ICQ.
- Дата рождения - Дата рождения лица.
- Адрес* - Полный почтовый адрес.
- Имя (подструктура: Имя персоны) - ФИО персоны. Поля подструктуры:
  - Фамилия - Фамилия персоны.
  - Имя - Личное имя персоны.
  - Отчество - Отчество или дополнительные имена персоны.
  - Значение - Полное (не разобранное) значение описываемой подструктуры.

Расширенная схема описания персоны:

Префикс - Почетный префикс к имени (например, "Sir", "Mr.", "Dr." и пр.).
Суффикс - Почетный суффикс к имени (например, “IV”).
Пол (элемент словаря: Пол) - Пол субъекта.

Расширенная схема описания персоны:

Текущая деятельность - Описание текущей деятельности или тематики деятельности.
Интересы - Описание области интересов человека.
Предыдущий опыт - Описание предыдущего опыта в рассматриваемой области.
Ключевые слова - Классификация с помощью списка слов с разделителями (например, через запятую).
Фото (подструктура: Файл данных) - Мультимедийное изображение, представляющее собой фотографию персоны, коллектива, здания организации и т.п.
Резюме (подструктура: Файл данных) - Резюме персоны (краткое описание личных сведений, достижений и т.п.).

Академическая схема описания персоны:

Ученая степень* (подструктура: Ученая степень) - Ученая степень персоны (доктор физ.-мат. наук, кандидат технич. наук и т.д.). Поля подструктуры:
- Обладатель (ссылка: Персона) - Обратная связь с лицом-обладателем ученой степени (заполняется автоматически).
- Дата присуждения - Дата присуждения ученой степени/звания.
- Ученая степень (элемент словаря: Ученая степень) - Наименование ученой степени как ссылка на элемент справочника (доктор физ.-мат. наук, кандидат технич. наук и т.д.).
- Специальность ВАК (элемент классификатора: Cпециальность ВАК) - Рубрика классификатора специальностей ВАК.
Ученое звание* (подструктура: Ученое звание) - Академическое или ученое звание (типа профессор, академик, доцент, ...). Поля подструктуры:
- Дата присуждения - Дата присуждения ученой степени/звания.
- Присудившая организация - Название организации, присудившей ученое звание (если организация не может быть указана ссылкой).
- Значение - Полное (не разобранное) значение описываемой подструктуры.
- Ученое звание (элемент словаря: Ученое звание) - Собственно само ученое звание как ссылка на элемент справочника (профессор, академик, доцент, с.н.с. и пр.).
- Присудившая организация (ссылка: Организационная единица) - Организация, присудившая ученое звание.

Историческая схема описания персоны:

Дата смерти - Дата смерти, в случае описании информации об исторической личности. По наличию данной даты историческая информация отличается от актуальной.
Место рождения - Место рождения данной личности, указывается в произвольной форме. Ввиду сложности поддержки исторической информации об административно-территориальном делении, классификатор регионов не используется для указания места рождения (поскольку на момент рождения административно-территориальное деление могло быть другим).
Место смерти - Место смерти данной исторической личности, указывается в произвольной форме. Ввиду сложности поддержки исторической информации об административно-территориальном делении, классификатор регионов не используется для указания места смерти (поскольку на момент смерти административно-территориальное деление могло быть другим).
Историческая справка - Историческая справка в произвольной форме.

Схема штата организаций:

Должность* (ссылка: Штатная должность) - Должности, занимаемые данным лицом.

Минимальная схема деятельности:

Класс Деятельность - Общий суперкласс для деятельности (проекты, мероприятия и т.д.). Деятельность имеет даты начала и окончания, исполнителей и описательные характеристики. Общий суперкласс для деятельности (проекты конференции и т.д.). Деятельность имеет даты начала и окончания. Свойства класса:

Название* - Имя, сопоставленное ресурсу, обычно, под которым он официально известен.
Сокращенное название - Сокращенное обозначение, как правило, аббревиатура.
Описание* - Текстовое описание ресурса.
Аннотация - Краткое описание или содержание источника.
Дата начала - Дата начала мероприятия, проекта или иной деятельности.
Дата окончания - Дата окончания мероприятия, проекта или иной деятельности.
Участник* (ссылка: Лицо) - Лицо, внесшее вклад в создание содержания ресурса.
Исполнитель* (ссылка: Лицо) - Субъект деятельности (организатор, исполнитель).

Базовая схема проектов:

Подкласс Проект - Данный класс описывает официально-зарегистрированные проекты: планируемые, проводимые и завершенные. Свойства класса:
- Код проекта - Код проекта по принятой системе кодирования.
- Ключевые слова - Классификация с помощью списка слов с разделителями (например, через запятую).
- Ведущая организация (ссылка: Организационная единица) - Организация, ведущая проект.
- Руководитель проекта (ссылка: Персона) - Лицо, являющееся руководителем проекта.
- Ответственное лицо (ссылка: Персона) - Лицо, являющееся ответственным за проект.
- Участвующая организация* (ссылка: Организационная единица) - Организация, участвующая в проекте.
- Участник* (ссылка: Персона) - Лицо, участвующее в проекте.
- Спонсор* (ссылка: Организационная единица) - Спонсор проведения мероприятий или деятельности, создания продуктов, издания публикаций и т.п.
- Web-адрес* - URL, в частности, HTTP-адрес контактной web-страницы, либо адрес FTP.
- Статус (элемент словаря: Статус проекта) - Статус проекта (планируется, начат, завершен, аннулирован,...).

Расширенное описание проектов:

Результат проекта* (ссылка: Результат деятельности) - Разработки, полученные в результате выполнения проекта.
Публикация по проекту* (ссылка: Документ) - Публикации, выполненные в рамках проекта.
Отчет по проекту* (ссылка: Документ) - Проектный отчет, описывающий результаты проведения данного проекта.

Академическая схема проектов:

Рубрика РФФИ* (элемент классификатора: Рубрика РФФИ) - Элемент классификатора областей знаний РФФИ .

Схема мероприятий:

Подкласс Мероприятие - Мероприятие (конференция, семинар и т.д.).

Свойства класса:

Ключевые слова - Классификация с помощью списка слов с разделителями (например, через запятую).
Адрес* - Полный почтовый адрес.
Участник* (ссылка: Персона) - Участник мероприятия.
Организатор* - Организатор мероприятия.
Web-адрес* - URL, в частности, HTTP-адрес контактной web-страницы, либо адрес FTP.

Минимальная схема результатов деятельности:

Класс Результат деятельности - Данный класс описывает разработки (“продукты”), документы и прочие результаты деятельности.

Свойства класса:

Название - Имя, сопоставленное ресурсу, обычно, под которым он официально известен.
Альтернативный заголовок* - Любая форма заголовка, используемая как замена или альтернатива официального заголовка ресурса.
Аннотация - Краткое описание или содержание источника.
Ключевые слова - Классификация с помощью списка слов с разделителями (например, через запятую).
Источник - Описание источника информации о данном ресурсе, например, наименование организации, ФИО и пр.
Авторские права - Авторские права (“копирайт”) на ресурс.
Создатель* (ссылка: Лицо) - Лицо, несущее первичную ответственность за создание содержания ресурса.
Участник* (ссылка: Лицо) - Лицо, внесшее вклад в создание содержания ресурса.
Web-адрес* - URL, в частности, HTTP-адрес контактной web-страницы, либо адрес FTP.

Схема документов:

Подкласс Документ - К данному классу относятся разного рода документы и публикации, как печатные, так и цифровые. Документ рассматривается как частный случай разработки. Свойства класса:
- Полный текст* (подструктура: Файл данных) - Полный текст документа в цифровом виде.
- Язык (элемент словаря: Язык) - Язык интеллектуального содержания ресурса.
- Подкласс Web-документ - Документ, доступный из Сети и не являющийся официальной публикацией.

Литература

Бездушный А.А., Бездушный А.Н., Жижченко А.Б., Калёнов Н.Е., Кулагин М.В., Серебряков В.А. Предложения по наборам метаданных для научных информационных ресурсов ЕНИП РАН // Сборник докладов Шестой Всероссийской конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" - RCDL’2004, с. 277-284, Пущино, 2004. http://www.impb.ru/~rcdl2004/cgi/get_paper_pdf.cgi?pid=42
Бездушный А.А., Бездушный А.Н., Нестеренко А.К., Серебряков В.А. , Сысоев Т.М. Возможности технологий ИСИР в поддержке Единого Научного Информационного Пространства РАН // Сборник докладов Шестой Всероссийской конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" - RCDL’2004, с.254-262, Пущино, 2004. http://www.impb.ru/~rcdl2004/cgi/get_paper_pdf.cgi?pid=43
RDF Primer. W3C Recommendation 10 February 2004. http://www.w3.org/TR/rdf-primer/
OWL Web Ontology Language Overview. W3C Recommendation 10 February 2004.
http://www.w3.org/TR/owl-features/
Expressing Qualified Dublin Core in RDF / XML. http://dublincore.org/documents/dcq-rdf-xml/
DCMI Metadata Terms. http://dublincore.org/documents/dcmi-terms/
DC Library Application Profile. http://www.dublincore.org/documents/library-application-profile/
DC Education Working Group: Draft Proposal. http://dublincore.org/documents/education-namespace/
DC Government Application Profile. gov-application-profile/"http://dublincore.org/documents/gov-application-profile/
DCMI Agents Working Group. http://dublincore.org/groups/agents/
PRISM: Publishing Requirements for Industry Standard Metadata. http://www.prismstandard.org/
National Archives of Australia – AGLS. http://www.naa.gov.au/recordkeeping/gov_online/agls/summary.html
Representing vCard Objects in RDF/XML. W3C Note 22 February 2001 http://www.w3.org/TR/vcard-rdf
FOAF Vocabulary Specification. Namespace Document 1 May 2004. http://xmlns.com/foaf/0.1/
BIBLINK Project. http://hosted.ukoln.ac.uk/biblink/
bibTeX Definition in Web Ontology Language (OWL) Version 0.1. Working Draft, 2004. http://visus.mit.edu/bibtex/0.1/
Math-Net Schemes. http://www.iwi-iuk.org/material/RDF/1.1/
UKOLN Research Support Libraries Programme Collection Description. http://www.ukoln.ac.uk/metadata/rslp/schema/
AKT Reference Ontology. http://www.aktors.org/publications/ontology/
KA2 - Knowledge Acquisition Community Ontology. http://ontobroker.semanticweb.org/ontos/ka2.html
SWRC - Semantic Web Research Community Ontology. http://ontobroker.semanticweb.org/ontos/swrc.html
CERIF: Common European Research Information Format. http://www.cordis.lu/cerif/src/about.htm
The CIDOC Conceptual Reference Model. http://cidoc.ics.forth.gr/
Вежневец А.А., Бездушный А.Н., Серебряков В.А., Цыганов С.А. О реализации систем поддержки применения результатов фундаментальных исследований // Сборник докладов Шестой Всероссийской конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции", с. 247-253, Пущино, 2004. http://www.impb.ru/~rcdl2004/cgi/get_paper_pdf.cgi?pid=38
Лаврёнова О.А., Вежневец А.А. Структура и реализация электронной библиотеки диссертаций в РГБ // Сборник докладов Второй Всероссийской научной конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции", Санкт-Петербург,.2003
П.М. Курив, Д.В. Котеров, Н.Е. Калёнов. Архитектура и функциональность Библиотечной Подсистемы ИСИР РАН // Электронный журнал, посвященный созданию и использованию электронных библиотек, том 7, выпуск 1. Москва: Институт развития информационного общества - 2004.
А. С. Аджиев, А. Н. Бездушный, С. П. Коновалов, В. А. Серебряков. Общероссийский WEB-портал математических ресурсов. // Сборник докладов Второй Всероссийской научной конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции", Санкт-Петербург, 2003
А.Н.Алексеев, А.В.Созыкин, Г.Ф.Масич, А.Н. Бездушный. Подсистема проведения конференций и ее метаданные // Электронный журнал, посвященный созданию и использованию электронных библиотек, том 7, выпуск 2. Москва: Институт развития информационного общества - 2004.
Р.А. Коротченко, И.О. Ярощук, А.Н. Бездушный. Версия схемы метаданных экспериментальных исследований с приложением в гидроакустике // Электронный журнал, посвященный созданию и использованию электронных библиотек, том 7, выпуск 1. Москва: Институт развития информационного общества - 2004.