|
  |
ПАКЕТ ВАРИАНТОВ входящий в выборку набор подвыборок, имеющих одинаковую структуру и различающихся координатными деревьями, числовым заполнением кубов данных либо модельными параметрами. Обсчет подвыборок проводится параллельно, одними и теми же методами. В предусмотренных режимом обсчета точках конвейера обработки производится сжатие пакета вариантов. При этом оставляется только подвыборка, оптимальная по пользовательским критериям, а по вариациям данных между остальными подвыборками рассчитываются показатели неопределенности. После сжатия вокруг отобранной подвыборки может быть построен новый пакет вариантов, если это предусмотрено режимом. ПАТТЕРН-АНАЛИЗ выявление паттернов ("рисунков") изменчивости данных вдоль переменной развертки, которые устойчивы к сдвигу по переменным сравнения. Использует модельную аппроксимацию изменчивости. Применяется как средство выделения устойчивых портретов ситуации, а также для настройки параметров модели по правильности воспроизведения паттернов, имеющихся в данных. ПАРАМЕТРЫ МОДЕЛИ численные коэффициенты, необходимые для работы модели, а также выбираемые экспертом дискретные установки. Включают и выбор уровня иерархии для многоуровневых моделей. Могут автоматически оптимизироваться в ходе решения обратной задачи подгонки модели под данные. Для этого необходимые параметры должны быть явно указаны как подгоняемые. ПЕРЕМЕННАЯ (КООРДИНАТА) информационный признак, примерно соответствующий понятию поля в базе данных. Система включает следующие переменные: время, пространство (территория), загрязнитель, среда (воздух, вода и т.п.), источник выброса загрязнителя, тип риска, экспозиционная группа населения, половозрастная группа населения, диагноз. Каждая переменная структурирована как иерархическое дерево координаты, состоящее из координатных интервалов разного уровня иерархии. Переменные могут быть числовыми (время, возраст) или логическими (вещество-загрязнитель). В кубе данных все переменные равноправны. Однако, в зависимости от выбора проекции куба данных, переменная может играть роль переменной развертки, переменной значения или переменной сравнения. По этим "ролям" переменные распределяет пользователь в процессе просмотра данных. ПОРТРЕТ СИТУАЦИИ наиболее выразительная, с точки зрения задачи пользователя, проекция совокупности кубов данных, описывающих задачу, в сокращенное, обычно 2- или 3-мерное пространство переменных. Включает выбор базового уровня иерархии данных для просмотра, выбор адекватных лагов между переменными, выбор фиксированных значений для невидимых переменных. ПРИЕМНИК см. "Источник". ПРОЕКЦИЯ КУБА ДАННЫХ представление куба данных, соответствующее конкретному выбору переменных развертки, переменных сравнения, невидимых переменных, визуализируемых уровней иерархии и др. Для однозначности представления данных необходимо зафиксировать сечение куба данных, выбираемое в рамках данной проекции. ПРОСТРАНСТВО КООРДИНАТ (ПРОСТРАНСТВО ПЕРЕМЕННЫХ) многомерное абстрактное пространство, оси которого соответствуют переменным (координатам). Служит для описания данных и моделей, включающих несколько переменных. Куб данных - заполненный данными фрагмент такого пространства. ПРАВИЛО АГРЕГАЦИИ правило вычисления значения данных для какого-либо координатного интервала по значениям данных содержащихся в нем подынтервалов следующего уровня иерархии. Наиболее простые правила агрегации - усреднение и суммирование данных. Более сложные правила требуются при агрегации угловых данных, данных по риску с логарифмической зависимостью от концентрации и др. Правило используется также для обратной операции - дезагрегации (распределения измененных значений более высоких интервалов по их подынтервалам). ПРЕДМЕТНЫЕ МОДЕЛИ модели, куда заложено знание о существе процесса, порождающего трансформацию данных. В системе 4 модели такого типа: модель распространения выброса, модель формирования риска, модель заболеваемости и модель смертности. Первая ответственна за передачу данных между блоками источника выброса и концентраций, вторая - между блоками концентраций и риска, третья - между блоками риска и заболеваемости, четвертая - между блоками заболеваемости и смертности. ПРИОРИТЕТЫ набор рассчитанных системой ситуаций, упорядоченный согласно пользовательским критериям важности, установленным как веса для отдельных переменных и блоков и их комбинаций. Представляют собой основную выходную информацию системы, предназначенную для ЛПР. |
РАНЖИРОВКА РЕГРЕССИОННЫЙ АНАЛИЗ система обеспечивает эксперту среду для основных операций по построению регрессионной модели связи данных различных блоков. Это включает выбор переменных, определение степени регрессии и уровня иерархии, на котором она проводится, селекцию и отсев выскакивающих значений, визуализацию дерева вкладов в регрессию и др. Используется как средство экспертного анализа связей между факторами среды и здоровья, а также как способ обучения регрессионной модели для последующего применения в рабочем режиме модельных прогнозов. РЕГРЕССИОННЫЕ МОДЕЛИ модели, описывающие некоторую переменную Z блока, куда подключен выход модели, как функцию Z=F(X,Y) некоторых переменных X, Y блока, куда подключен вход модели. Независимых переменных может быть и больше или меньше, чем две. Параметрами модели являются коэффициенты разложения функции F в ряд - обычно по полиномам. Кроме того, имеются установочные параметры - порядок полинома, допустимое число независимых переменных и др. Параметры формируются на этапе подгонки модели к обучающим данным, в которые входят значения X, Y и Z. На рабочем этапе модель используется для прогноза значений Z по значениям X и Y или для решения обратной задачи восстановления значений X, Y по значениям Z. Возможна комбинация работы и обучения: формируется невязка прогноза с реальными измерениями Z, и для нее решается обратная задача, в результате чего корректируются либо значения X, Y, либо параметры модели. РЕПЕРНЫЕ СИТУАЦИИ пакет вариантов, состоящий из ситуаций, которые ограничивают пространство возможных решений обратной задачи. Содержит модельные прогнозы, представляющие собой решения соответствующих прямых задач. Выборка исходных данных для этого создается пользователем. РЕЖИМ ОБРАБОТКИ ИНФОРМАЦИИ в настоящее время в системе имеется 7 режимов: обзор информации; модельный прогноз; выделение горячих точек; определение приоритетных проблем; решение обратных задач; поиск связей между данными о среде и здоровье; отладка и адаптация моделей. В силу открытости системы, этот набор может быть изменен пользователем, в т.ч. созданы дополнительные режимы. Каждый режим задает набор установок входной и выходной информации, которые должны быть заданы пользователем, и набор операций обработки, которые должны быть выполнены вручную и/или автоматически. РИСК условное название численной меры, характеризующей ожидаемую тяжесть последствий для здоровья в зависимости от загрязнения среды. Индивидуальный риск определяется в зависимости от сценария экспозиции индивида к загрязнению среды. Популяционный риск определяется для популяции в целом, в зависимости от распеределения по ней различных сценариев экспозиции и численности экспозиционных групп. Существуют различные типы риска. Некоторые из них имеют прямой вероятностный смысл как "вероятность получить заболевание данной группы за заданный период времени". Другие имеют достаточно расплывчатый смысл "индекса общей опасности для здоровья, связанной с данным загрязнителем". В моделях формирования риска, используемых в системе, задействованы 3 различных типа риска: один - для канцерогенов, два - для неканцерогенов. |
СЕЧЕНИЕ ДАННЫХ подмножество куба данных с меньшей размерностью, получаемое фиксацией одной или нескольких переменных сравнения. Напр., сечение модельного прогноза риска при фиксированном загрязнителе. СИСТЕМА ОТСЧЕТА куб данных, относительно которого рассматриваются данные из другого куба. "Относительно" может означать либо деление, либо вычитание. Напр., представление концентраций относительно ПДК - деление, представление числа случаев заболевания относительно фона - вычитание. Система отсчета не обязана задаваться в явном виде по всем координатам: для расчета смертности "на 1000 чел." задается в качестве системы отсчета куб данных "население по территориям" с одной переменной - "территория". СИТУАЦИЯ совокупность информации (как данных, так и модельных прогнозов) для нескольких, обычно всех, блоков системы. Содержит уровни иерархии: может включать "подситуации", соответствующие тому или иному выбору уровня координатных интервалов в деревьях координат одного или нескольких блоков. СЦЕНАРИЙ ЭКСПОЗИЦИИ модель коэффициентов связи концентрации загрязнителя с индивидуальным риском, описывающая их зависимость от принадлежности индивида к той или иной экспозиционной группе. Эти группы различаются половозрастным и профессиональным составом, территорией и временным интервалом, где происходит экспозиция, и т.д. Сценарии экспозиции вырабатываются экспертом применительно к той или иной конкретной территории, однако существуют и типовые сценарии. Помимо коэффициентов, связанных с экспозицией, зависимость риска от концентрации включает коэффициент токсичности загрязнителя, который берется из специальных баз данных, прилагаемых к системе. |
ТИП ПОЛЬЗОВАТЕЛЯ система предусматривает два типа пользователей: ЛПР и эксперт. Они различаются функционально: ЛПР работает с готовой выходной информацией и не может самостоятельно произвести повторный обсчет выборки. Если в функции ЛПР входит отбор одного из нескольких вариантов, все они должны быть включены в выходную информацию. Функция эксперта - постановка задачи, создание пакета вариантов ее решения, его настройка, в т.ч. с повторным обсчетом задачи, и селекция результатов для включения в выходную информацию. |
|
ФОН набор данных, который можно считать "типичным", за вычетом горячих точек и выскакивающих значений. Для одномерного набора данных вдоль некоторой переменной развертки и при фиксированных остальных переменных, фон - константа. Для всего куба данных фоновый куб получается согласованием этих констант по пользовательским критериям при всевозможных способах выбора переменной развертки и переменных сравнения. В результате фон получается изменяющимся вдоль всех переменных. Эта зависимость аппроксимируется моделью. Фоновый куб данных блока используется в качестве одной из систем отсчета. |
|
© ИКИ РАН, 1998-2001 |