СОВРЕМЕННЫЕ ТЕХНОЛОГИИ В ИНФОРМАЦИОННОМ ОБЕСПЕЧЕНИИ НАУКИ

О РЕАЛИЗАЦИИ В СОСТАВЕ
ИНФОРМАЦИОННОГО WEB-ПОРТАЛА
РАН СЛУЖБЫ ВЗАИМОДЕЙСТВИЯ
С ИСТОЧНИКАМИ ИНФОРМАЦИИ

Р.Б. Чавтараев
(ИПИ РАН)

Введение.

Спецификой создания Web-портала РАН является наличие большого количества уже существующей информации. Эта информация представлена в различных форматах и может физически располагаться в различных хранилищах. Некоторая её часть имеет собственное представление в Интернете, другая представляет собой базы данных на различных СУБД, в некоторых случаях ведутся работы по формализации данных. Поскольку WEB-портал должен не только отображать эти данные, но и в ряде случаев управлять ими, встает вопрос о средствах, с помощью которых можно реализовать интеграцию этой информации (и манипуляцию ей) в едином технологическом ключе. Очевидно, что в составе WEB-портала должна присутствовать службы, реализующие взаимодействие ядра портала с источниками информации.

Информационные компоненты

В общем случае, источник информации представляет собой формализованные (в разной степени) данные и набор сервисов или служб, построенных для использования этих данных. Для обеспечения с пользовательской стороны единого информационно-функционального пространства, состоящего по сути из разнородных кусков информации, необходимо иметь, как минимум, единый протокольный слой для взаимодействия с остальными службами портала, а также представление для каждого информационного источника, отвечающее требованиям этого протокольного слоя. Такое представление источника информации определяется как информационный компонент. Таким образом, взаимосвязь портала и источников информации организуется посредством информационных компонентов.

Службы взаимодействия

Взаимодействие с источниками информации можно подразделить на две части:

манипуляции с данными и управление. Под манипуляциями с данными понимается собственно "информационная" составляющая взаимодействия, то есть поиск, доставка, представление, защита и т.п. Управление - "административная" составляющая, то есть регистрация информационных источников, определение параметров взаимодействия и пр. Каждая часть взаимодействия реализуется отдельной службой: соответственно службой доступа к ресурсам информационных компонентов и службой управления информационными компонентами.

Служба доступа к ресурсам информационных компонентов

Эта служба является "рабочей лошадкой" системы взаимодействия с информационными источниками. Именно она обеспечивает импорт данных для портала из различных хранилищ. Она организует информационный поток между другими портальными службами и информационными компонентами, а через них и с информационными источниками. Она также обеспечивает получение данных в нужном формате (RDF) и сквозную адресацию этих данных, вводит новый уровень абстракции между ядром портала и источником информации. В этом случае, получатель данных не должен располагать информацией о том, где находятся нужные данные (в каком информационном источнике) и каким образом их можно получить. Эту работу выполняет данная служба. Информационные компоненты в этом плане играют роль переходников (адаптеров), на которые возложена роль взаимодействия с источниками информации и, если необходимо, преобразование форматов данных при транспортировке в портал.

Служба управления информационными компонентами

Для подключения новых информационных источников и отключения потерявших актуальность, а также настройки параметров взаимодействия предназначена служба управления информационными компонентами. Служба имеет в своем составе реестр информационных компонентов и реестр типов данных.

Реестр информационных компонентов содержит информацию о зарегистрированных информационных компонентах и соответственно подключенных информационных источниках. Эти данные используются при организации потоков информации между информационным источником и порталом.

Реестр типов представляет собой RDFS-описание типов, зарегистрированных в системе. Описание типа не привязывается к какому-либо информационному источнику и может быть использовано при взаимодействии с любыми информационными источниками.

Платформа, реализация и протокольная поддержка

Технология Web-портала РАН основывается на платформе Microsoft .NET. Соответственно, службы реализованы в виде .NET сборок и при дальнейшем расширении системы могут быть расширены до Web-сервисов. На первом этапе не имеет смысла реализовывать эти службы только как Web-сервисы - взаимодействие по протоколу http вносит некоторые ограничения и понижает быстродействие. Применение этой технологии оправдано только при распределенности и мультиплатформенности компонентов системы.

А вот взаимодействие с источниками информации в ряде случаев целесообразно построить на основе протокола SOAP, так как этот стандарт получил широкое распространение и поддерживается информационными системами. Источник информации как раз является территориально удаленной единицей, которая может быть реализована на различных платформах. В некоторых случаях можно представить информационный источник как Web-сервис.

Форматы обмена

Поскольку заранее не возможно предопределить какого рода данными будет осуществляться обмен, а очевидно, что обмен будет производиться через Web, формат обмена должен позволять представлять любой вид данных, то есть обладать универсальной выразительностью.

Формат также должен быть широко распространенным, то есть таким, для которого для каждой платформы можно было легко получить анализатор синтаксиса и API для манипуляций с данными, то есть иметь синтаксическую интероперабельность.

Этими свойствами обладает XML, так как в XML можно представить все, для чего определяется грамматика.

Однако XML не в состоянии обеспечить семантическую интероперабельность компонентов. В этом случае необходимо применение RDF как формата представления данных и RDFS для описания семантики. В нашем случае, описание типов и выглядит в виде RDFS.