материал средней сложности

СТРУКТУРА СИСТЕМЫ

EHIPS - система СРЕДА-ЗДОРОВЬЕ


   Структура данных система иерархическая.
   Нижний уровень - "случай", обычно соответствующий единичной записи в базе данных. Следующий уровень - элементарный интервал одной из координат системы: период времени, единица территориального деления, вещество-загрязнитель и др. Соответствующие данные - число случаев (напр., заболевания), попадающих в интервал, или средние (напр., концентрации) по интервалу.
   Интервалы образуют иерархию (напр., один момент - день - месяц - год), выбору уровня которой традиционно уделяется большое внимание в задачах "среда-здоровье". Это следующий уровень - дерево соответствующей координаты.
   Каждый тип информации имеет свой набор характерных координат, которые образуют куб данных. Это следующий уровень иерархии данных. Напр., данные о концентрациях размещаются в кубе с осями "загрязняющее вещество - территория - время". Каждая ось - координатное дерево.
   Следующий уровень иерархии - блок, объединяющий все кубы данных, где находится информация одного типа. Основных кубов в каждом блоке три: данные измерений, модельный прогноз и фон (система отсчета). В настоящее время блоков в системе пять. Они работают соответственно с информацией об источниках загрязнения, концентрациях загрязнителей в средах, риске для здоровья, связанном с этими концентрациями, заболеваемостью как проявлением риска, смертностью как одним из исходов заболеваний.
   Блоки образуют причинно-следственную цепочку. По ней идет конвейерная обработка информации: модельный прогноз от предыдущего блока к следующему с привязкой прогноза и данных измерений. При обнаружении значительного рассогласования или группы горячих точек производится откат к предыдущему блоку с диагностикой причин методом решения обратной задачи и коррекцией выборки данных или параметров модели.
   Блокам соответствуют основные программные модули системы. Они однотипны и различаются только набором координат и подключенными базами данных и моделями. Эти модули - "позвоночный столб" всей системы.
   Верхний уровень иерархии данных - "опасность", т.е. совокупность данных из разных блоков, характеризующая ту или иную проблему "среда-здоровье". Этому уровню соответствует вся выборка данных в целом и вся совокупность блоков. Однако допускается представление выборки как наложения нескольких опасностей. Оно производится в режиме определения приоритетов, и за ним обычно должно следовать разделение выборки на части, соответствующие отдельным опасностям.
   Система содержит два типа пользовательского интерфейса: задание установок для конвейерного режима и "исследовательскую среду". Установки специфичны для каждого режима, хотя среди них есть и общие. Исследовательская среда универсальна, и в нее можно выйти из любого режима.
   Входные установки определяют набор исходных данных и способ из считывания из БД, в частности, соответствие полей и записей БД и внутренних структур данных системы. Задаются также "вводные", определяющие пакет вариантов данных, используемый в расчете.
   Установки обработки задают значения модельных параметров, находящихся в ведении эксперта, и критерии для оптимизации, определения горячих точек и пр. Выходные установки задают информацию, включаемую в выходной документ, формируемый по результатам обработки. Это набор отображаемых кубов данных, выбор уровня иерархии и "разреза" каждого куба, форма представления информации - таблица, график, карта и пр.
   Исследовательская среда содержит интерфейс для пробного запуска любой предметной модели, подключенной к системе, установки ее параметров, отбора обсчитываемых координатных интервалов и пр. Имеется также интерфейс для построения эмпирических моделей: корреляционно-регрессионного анализа, кластерного и паттерн-анализа. Два последних типа анализа используются также для выработки оптимальной структуры уровней и групп в выборке.

Предыдущая тема Оглавление Следующая тема

© ИКИ РАН, 1998-2001