|
СТРУКТУРА СИСТЕМЫ |
|
Структура данных система иерархическая.
Нижний уровень - "случай", обычно соответствующий единичной записи в базе данных.
Следующий уровень - элементарный интервал одной из координат системы: период времени, единица территориального деления, вещество-загрязнитель и др. Соответствующие данные - число случаев (напр., заболевания), попадающих в интервал, или средние (напр., концентрации) по интервалу.
Интервалы образуют иерархию (напр., один момент - день - месяц - год), выбору уровня которой традиционно уделяется большое внимание в задачах "среда-здоровье". Это следующий уровень - дерево соответствующей координаты.
Каждый тип информации имеет свой набор характерных координат, которые образуют куб данных. Это следующий уровень иерархии данных. Напр., данные о концентрациях размещаются в кубе с осями "загрязняющее вещество - территория - время". Каждая ось - координатное дерево.
Следующий уровень иерархии - блок, объединяющий все кубы данных, где находится информация одного типа. Основных кубов в каждом блоке три: данные измерений, модельный прогноз и фон (система отсчета). В настоящее время блоков в системе пять. Они работают соответственно с информацией об источниках загрязнения, концентрациях загрязнителей в средах, риске для здоровья, связанном с этими концентрациями, заболеваемостью как проявлением риска, смертностью как одним из исходов заболеваний.
Блоки образуют причинно-следственную цепочку. По ней идет конвейерная обработка информации: модельный прогноз от предыдущего блока к следующему с привязкой прогноза и данных измерений. При обнаружении значительного рассогласования или группы горячих точек производится откат к предыдущему блоку с диагностикой причин методом решения обратной задачи и коррекцией выборки данных или параметров модели.
Блокам соответствуют основные программные модули системы. Они однотипны и различаются только набором координат и подключенными базами данных и моделями. Эти модули - "позвоночный столб" всей системы.
Верхний уровень иерархии данных - "опасность", т.е. совокупность данных из разных блоков, характеризующая ту или иную проблему "среда-здоровье". Этому уровню соответствует вся выборка данных в целом и вся совокупность блоков. Однако допускается представление выборки как наложения нескольких опасностей. Оно производится в режиме определения приоритетов, и за ним обычно должно следовать разделение выборки на части, соответствующие отдельным опасностям.
Система содержит два типа пользовательского интерфейса: задание установок для конвейерного режима и "исследовательскую среду". Установки специфичны для каждого режима, хотя среди них есть и общие. Исследовательская среда универсальна, и в нее можно выйти из любого режима.
Входные установки определяют набор исходных данных и способ из считывания из БД, в частности, соответствие полей и записей БД и внутренних структур данных системы. Задаются также "вводные", определяющие пакет вариантов данных, используемый в расчете.
Установки обработки задают значения модельных параметров, находящихся в ведении эксперта, и критерии для оптимизации, определения горячих точек и пр.
Выходные установки задают информацию, включаемую в выходной документ, формируемый по результатам обработки. Это набор отображаемых кубов данных, выбор уровня иерархии и "разреза" каждого куба, форма представления информации - таблица, график, карта и пр.
Исследовательская среда содержит интерфейс для пробного запуска любой предметной модели, подключенной к системе, установки ее параметров, отбора обсчитываемых координатных интервалов и пр. Имеется также интерфейс для построения эмпирических моделей: корреляционно-регрессионного анализа, кластерного и паттерн-анализа. Два последних типа анализа используются также для выработки оптимальной структуры уровней и групп в выборке.