Глоссарий

материал средней сложности

ТЕРМИНЫ и ПОНЯТИЯ

EHIPS - система СРЕДА-ЗДОРОВЬЕ

А Б В Г Д Е Ж
З И К Л М Н О
П Р С Т У Ф Х
Ц Ч Ш Щ Э Ю Я

 
П

ПАКЕТ ВАРИАНТОВ входящий в выборку набор подвыборок, имеющих одинаковую структуру и различающихся координатными деревьями, числовым заполнением кубов данных либо модельными параметрами. Обсчет подвыборок проводится параллельно, одними и теми же методами. В предусмотренных режимом обсчета точках конвейера обработки производится сжатие пакета вариантов. При этом оставляется только подвыборка, оптимальная по пользовательским критериям, а по вариациям данных между остальными подвыборками рассчитываются показатели неопределенности. После сжатия вокруг отобранной подвыборки может быть построен новый пакет вариантов, если это предусмотрено режимом.
В начало
ПАТТЕРН-АНАЛИЗ выявление паттернов ("рисунков") изменчивости данных вдоль переменной развертки, которые устойчивы к сдвигу по переменным сравнения. Использует модельную аппроксимацию изменчивости. Применяется как средство выделения устойчивых портретов ситуации, а также для настройки параметров модели по правильности воспроизведения паттернов, имеющихся в данных.
В начало
ПАРАМЕТРЫ МОДЕЛИ численные коэффициенты, необходимые для работы модели, а также выбираемые экспертом дискретные установки. Включают и выбор уровня иерархии для многоуровневых моделей. Могут автоматически оптимизироваться в ходе решения обратной задачи подгонки модели под данные. Для этого необходимые параметры должны быть явно указаны как подгоняемые.
В начало
ПЕРЕМЕННАЯ (КООРДИНАТА) информационный признак, примерно соответствующий понятию поля в базе данных. Система включает следующие переменные: время, пространство (территория), загрязнитель, среда (воздух, вода и т.п.), источник выброса загрязнителя, тип риска, экспозиционная группа населения, половозрастная группа населения, диагноз. Каждая переменная структурирована как иерархическое дерево координаты, состоящее из координатных интервалов разного уровня иерархии. Переменные могут быть числовыми (время, возраст) или логическими (вещество-загрязнитель). В кубе данных все переменные равноправны. Однако, в зависимости от выбора проекции куба данных, переменная может играть роль переменной развертки, переменной значения или переменной сравнения. По этим "ролям" переменные распределяет пользователь в процессе просмотра данных.
В начало
ПОРТРЕТ СИТУАЦИИ наиболее выразительная, с точки зрения задачи пользователя, проекция совокупности кубов данных, описывающих задачу, в сокращенное, обычно 2- или 3-мерное пространство переменных. Включает выбор базового уровня иерархии данных для просмотра, выбор адекватных лагов между переменными, выбор фиксированных значений для невидимых переменных.
В начало
ПРИЕМНИК см. "Источник".
В начало
ПРОЕКЦИЯ КУБА ДАННЫХ представление куба данных, соответствующее конкретному выбору переменных развертки, переменных сравнения, невидимых переменных, визуализируемых уровней иерархии и др. Для однозначности представления данных необходимо зафиксировать сечение куба данных, выбираемое в рамках данной проекции.
В начало
ПРОСТРАНСТВО КООРДИНАТ (ПРОСТРАНСТВО ПЕРЕМЕННЫХ) многомерное абстрактное пространство, оси которого соответствуют переменным (координатам). Служит для описания данных и моделей, включающих несколько переменных. Куб данных - заполненный данными фрагмент такого пространства.
В начало
ПРАВИЛО АГРЕГАЦИИ правило вычисления значения данных для какого-либо координатного интервала по значениям данных содержащихся в нем подынтервалов следующего уровня иерархии. Наиболее простые правила агрегации - усреднение и суммирование данных. Более сложные правила требуются при агрегации угловых данных, данных по риску с логарифмической зависимостью от концентрации и др. Правило используется также для обратной операции - дезагрегации (распределения измененных значений более высоких интервалов по их подынтервалам).
В начало
ПРЕДМЕТНЫЕ МОДЕЛИ модели, куда заложено знание о существе процесса, порождающего трансформацию данных. В системе 4 модели такого типа: модель распространения выброса, модель формирования риска, модель заболеваемости и модель смертности. Первая ответственна за передачу данных между блоками источника выброса и концентраций, вторая - между блоками концентраций и риска, третья - между блоками риска и заболеваемости, четвертая - между блоками заболеваемости и смертности.
В начало
ПРИОРИТЕТЫ набор рассчитанных системой ситуаций, упорядоченный согласно пользовательским критериям важности, установленным как веса для отдельных переменных и блоков и их комбинаций. Представляют собой основную выходную информацию системы, предназначенную для ЛПР.
В начало

Р

РАНЖИРОВКА
В начало
РЕГРЕССИОННЫЙ АНАЛИЗ система обеспечивает эксперту среду для основных операций по построению регрессионной модели связи данных различных блоков. Это включает выбор переменных, определение степени регрессии и уровня иерархии, на котором она проводится, селекцию и отсев выскакивающих значений, визуализацию дерева вкладов в регрессию и др. Используется как средство экспертного анализа связей между факторами среды и здоровья, а также как способ обучения регрессионной модели для последующего применения в рабочем режиме модельных прогнозов.
В начало
РЕГРЕССИОННЫЕ МОДЕЛИ модели, описывающие некоторую переменную Z блока, куда подключен выход модели, как функцию Z=F(X,Y) некоторых переменных X, Y блока, куда подключен вход модели. Независимых переменных может быть и больше или меньше, чем две. Параметрами модели являются коэффициенты разложения функции F в ряд - обычно по полиномам. Кроме того, имеются установочные параметры - порядок полинома, допустимое число независимых переменных и др. Параметры формируются на этапе подгонки модели к обучающим данным, в которые входят значения X, Y и Z. На рабочем этапе модель используется для прогноза значений Z по значениям X и Y или для решения обратной задачи восстановления значений X, Y по значениям Z. Возможна комбинация работы и обучения: формируется невязка прогноза с реальными измерениями Z, и для нее решается обратная задача, в результате чего корректируются либо значения X, Y, либо параметры модели.
В начало
РЕПЕРНЫЕ СИТУАЦИИ пакет вариантов, состоящий из ситуаций, которые ограничивают пространство возможных решений обратной задачи. Содержит модельные прогнозы, представляющие собой решения соответствующих прямых задач. Выборка исходных данных для этого создается пользователем.
В начало
РЕЖИМ ОБРАБОТКИ ИНФОРМАЦИИ в настоящее время в системе имеется 7 режимов: обзор информации; модельный прогноз; выделение горячих точек; определение приоритетных проблем; решение обратных задач; поиск связей между данными о среде и здоровье; отладка и адаптация моделей. В силу открытости системы, этот набор может быть изменен пользователем, в т.ч. созданы дополнительные режимы. Каждый режим задает набор установок входной и выходной информации, которые должны быть заданы пользователем, и набор операций обработки, которые должны быть выполнены вручную и/или автоматически.
В начало
РИСК условное название численной меры, характеризующей ожидаемую тяжесть последствий для здоровья в зависимости от загрязнения среды. Индивидуальный риск определяется в зависимости от сценария экспозиции индивида к загрязнению среды. Популяционный риск определяется для популяции в целом, в зависимости от распеределения по ней различных сценариев экспозиции и численности экспозиционных групп. Существуют различные типы риска. Некоторые из них имеют прямой вероятностный смысл как "вероятность получить заболевание данной группы за заданный период времени". Другие имеют достаточно расплывчатый смысл "индекса общей опасности для здоровья, связанной с данным загрязнителем". В моделях формирования риска, используемых в системе, задействованы 3 различных типа риска: один - для канцерогенов, два - для неканцерогенов.
В начало

С

СЕЧЕНИЕ ДАННЫХ подмножество куба данных с меньшей размерностью, получаемое фиксацией одной или нескольких переменных сравнения. Напр., сечение модельного прогноза риска при фиксированном загрязнителе.
В начало
СИСТЕМА ОТСЧЕТА куб данных, относительно которого рассматриваются данные из другого куба. "Относительно" может означать либо деление, либо вычитание. Напр., представление концентраций относительно ПДК - деление, представление числа случаев заболевания относительно фона - вычитание. Система отсчета не обязана задаваться в явном виде по всем координатам: для расчета смертности "на 1000 чел." задается в качестве системы отсчета куб данных "население по территориям" с одной переменной - "территория".
В начало
СИТУАЦИЯ совокупность информации (как данных, так и модельных прогнозов) для нескольких, обычно всех, блоков системы. Содержит уровни иерархии: может включать "подситуации", соответствующие тому или иному выбору уровня координатных интервалов в деревьях координат одного или нескольких блоков.
В начало
СЦЕНАРИЙ ЭКСПОЗИЦИИ модель коэффициентов связи концентрации загрязнителя с индивидуальным риском, описывающая их зависимость от принадлежности индивида к той или иной экспозиционной группе. Эти группы различаются половозрастным и профессиональным составом, территорией и временным интервалом, где происходит экспозиция, и т.д. Сценарии экспозиции вырабатываются экспертом применительно к той или иной конкретной территории, однако существуют и типовые сценарии. Помимо коэффициентов, связанных с экспозицией, зависимость риска от концентрации включает коэффициент токсичности загрязнителя, который берется из специальных баз данных, прилагаемых к системе.
В начало

Т

ТИП ПОЛЬЗОВАТЕЛЯ система предусматривает два типа пользователей: ЛПР и эксперт. Они различаются функционально: ЛПР работает с готовой выходной информацией и не может самостоятельно произвести повторный обсчет выборки. Если в функции ЛПР входит отбор одного из нескольких вариантов, все они должны быть включены в выходную информацию. Функция эксперта - постановка задачи, создание пакета вариантов ее решения, его настройка, в т.ч. с повторным обсчетом задачи, и селекция результатов для включения в выходную информацию.
В начало

У
УРОВЕНЬ ИЕРАРХИИ характеристика расположения координатного интервала в дереве координаты. Практически по всем координатам интервалы имеют естественную иерархическую структуру: момент времени-день-месяц-год; точка-район-город-область; годовая возрастная группа-стандартная возрастная группа-все возраста данного пола - все население; диагноз по МКБ-группа диагнозов 3 уровня-... Однако, пользователь может создавать любые другие уровни иерархии. При этом необходимо обязательно включать те уровни, которые представлены в доступных пользователю базах данных. Также - характеристика компонент модели. Например, регрессионная модель F(X,Y) может быть произведением двух подмоделей-компонент более низкого уровня: f(X) и g(Y).
В начало

Ф

ФОН набор данных, который можно считать "типичным", за вычетом горячих точек и выскакивающих значений. Для одномерного набора данных вдоль некоторой переменной развертки и при фиксированных остальных переменных, фон - константа. Для всего куба данных фоновый куб получается согласованием этих констант по пользовательским критериям при всевозможных способах выбора переменной развертки и переменных сравнения. В результате фон получается изменяющимся вдоль всех переменных. Эта зависимость аппроксимируется моделью. Фоновый куб данных блока используется в качестве одной из систем отсчета.
В начало

Х

В начало

Предыдущий словарь Глоссарий Оглавление Следующий словарь

© ИКИ РАН, 1998-2001