РАСПРЕДЕЛЕННАЯ ИСТОРИКО-ГЕОГРАФИЧЕСКАЯ СИСТЕМА С ПРИМЕНЕНИЕМ ТЕХНОЛОГИИ SW
И.А. Дьяконов, T.М. Сысоев
(ВЦ РАН)
Распределенность — одна из важнейших черт современных информационных систем. Совершенно очевидно, что информационные ресурсы даже одной узкоспециализированной предметной области не могут быть размещены в пределах одного вычислительного устройства. Поэтому необходимы методы и инструменты интеграции информации, которая распределена среди множества таких устройств. Также стоит отметить, что с увеличением объема информации все труднее и труднее становится ее обрабатывать и организовывать поиск нужной. На текущий момент, в основном, применяются методы поиска, основанные на поиске словоформ (с использованием морфологии, как в поисковых машинах). Очевидно, что такой подход более или менее применим для поиска текстовой информации человеком, но он неприемлем для машинной обработки. Для возможности машинной обработки и построения сложных, адекватных запросов необходимо знать понятия и связи между понятиями предметной области, то есть сама предметная область с достаточной детализацией должна быть формально описана. Подход Semantic Web (SW) решает, в том числе, и проблему формального описания предметной области (понятий, связей) в виде, пригодном для машинной обработки.
Semantic Web (SW) — это концепция эволюции World Wide Web (WWW) в Сеть, в которой каждый ресурс на естественном языке был бы снабжен описанием, понятным компьютеру. Таким образом, особое место в Semantic Web уделяется семантике данных. Изначально WWW не был рассчитан на машинную семантическую обработку, только люди могут понять семантику того или иного документа, но не машина. Подход Semantic Web позволяет формально описывать семантику данных для машины, чтобы данные, представленные в документе, были не только набором символов, но также и несли смысл, что позволит осуществлять вполне “разумный” поиск данных, логический вывод, и автоматизировать эти процессы. Также применение технологии SW позволяет осуществить интеграцию распределенных информационных ресурсов, описать формат обмена данными.
При взаимодействии со специалистами в области истории было решено апробировать подход SW для исторической предметной области, так как в силу сложности организации самой предметной области, этот подход, кажется, как нельзя лучше подходит для решения задач, возникающих у историков. С другой стороны, история тесно связана с географическими местами и, соответственно, зачастую ценность представляет сама визуализация тех или иных исторических данных. Специалисты, работающие в этой сфере, интересуются фактами и связывающими их закономерностями. Накоплен огромный исторический материал, который необходимо не только хранить, но и, что более важно, уметь обрабатывать и, по возможности, получать новые факты. Визуальное представление данных дает один из мощнейших подходов к пониманию и осмыслению информации. Таким образом, возникает естественное желание совместить следующие подходы: накопление, систематизацию и хранение исторических данных с географическим, наглядным их представлением. Географическое представление исторических данных является само по себе ценной и важной задачей.
Работа рассматривает применение технологии Semantic Web для создания распределенной историко-географической информационной системы, позволяющей работать с историческими сущностями и визуализировать историко-географические данные.
Сначала выполняется описание исторической предметной области при помощи OWL-онтологии. Онтология формально предоставляет описание сущностей (таких как персона, событие, место и т.д.) и указывает связи и свойства связей между этими сущностями. В итоге это поможет систематизировать информацию, определить (описать) ее семантику, отвечать на более сложные запросы пользователей более “разумными” ответами, чем при контекстуальном поиске. К тому же будет определен формат обмена уже семантически нагруженными данными в распределенной среде — в среде с разными источниками данных. После этого разрабатывается ГИС-компонента для визуального отображения тех или иных исторических данных на картах. Необходимость ГИС-компоненты обусловлена тем, что возникают задачи визуализации динамических изменений каких-либо значений (например, население городов) с течением времени.
Что касается геопространственных данных, то их, по ряду объективных причин, так же нельзя просто аккумулировать в одном месте. Поэтому изначально рассматривается ситуация с распределенными геопространственными данными (впрочем, как и распределенными историческими данными). Для получения сторонних геопространственных данных используется технология веб-сервисов. Так, например, не обладая информацией о границах государств, эту информацию можно получить, а затем использовать, благодаря существующим источникам данных, которые предоставляют ее посредством веб-сервисов. При этом можно автоматически делать выводы, например, о принадлежности городов тем или иным странам, первоначально не обладая такой информацией, что показывает связь между геопространственными и историческими данными.
Отличительной особенностью исторической информации является присутствие временного фактора. Время не может рассматриваться просто как свойство того или иного объекта в силу того, что само по себе может определять “продолжительность жизни” этого свойства.
На текущий момент подготовлена актуальная онтология исторической области, разрабатывается подсистема взаимодействия ГИС-компоненты с другими источниками геопространственной информации посредством веб-сервисов, а также вопрос интеграции существующих геопространственных данных с историческими данными. Идет работа над созданием визуального редактора запросов, который позволит конструировать в графической форме запросы к системе, основываясь на онтологической информации и геопространственных данных. Именно использование технологии SW и описание онтологии предметной области позволило вообще говорить о таком редакторе запросов, который, безусловно, удобнее, более гибок и понятнее стандартных методов описания запросов.
Литература: