Глоссарий

материал средней сложности

ТЕРМИНЫ и ПОНЯТИЯ

EHIPS - система СРЕДА-ЗДОРОВЬЕ

А Б В Г Д Е Ж
З И К Л М Н О
П Р С Т У Ф Х
Ц Ч Ш Щ Э Ю Я

 
З

В начало

И

ИСТОЧНИК координатный интервал одного блока, служащий причинным фактором, определяющим данные в некотором соответственном координатном интервале - приемнике другого блока. Напр., координатный интервал, задающий некую технологию или производство в блоке выбросов, - источник для координатного интервала "Измерительный пост №..." вдоль переменной "Территория" в блоке концентраций. Координатный интервал, задающий экспозиционную группу в блоке риска, - источник сразу для нескольких координатных интервалов переменной "Половозрастная группа" в блоке заболеваемости.
В начало

К

КВАНТИЛЬ пороговое значение переменной, ниже которого находится заданный процент общего веса ее гистограммы данных. Этот процент называется уровнем квантиля (квантиль уровня 90% и т.д.). Используется для выделения горячих точек и выскакивающих значений, а также как правило агрегации данных (в верхний уровень иерархии помещается некий квантиль гистограммы нижних уровней).
В начало
КЛАСТЕРНЫЙ АНАЛИЗ создание иерархической группировки данных с последующей записью кластеров в виде координатного дерева. Проводится методом минимизации неопределенности. Используется для уточнения выборки и экспертного анализа групп горячих точек и выскакивающих значений.
В начало
КОД ДАННЫХ кодовое число или слово в базе данных, которое позволяет отнести ячейку БД к одному из координатных интервалов. Например, координатному интервалу с именем "1 января 1999 г." может соответствовать код данных "1/1/99", координатному интервалу с именем "Дети мужского пола от 0 до 1 года" - код данных "М1" и т.д.
В начало
КООРДИНАТА ЗНАЧЕНИЯ (ПЕРЕМЕННАЯ ЗНАЧЕНИЯ) переменная, соответствующая основному типу данных блока: объему или концентрации загрязнителя в выбросе - для блока выбросов, числу случаев заболевания - для блока заболеваемости и т.д. Именно ее значение размещается в клетках куба данных. Обычно соответствует ординате графика.
В начало
КООРДИНАТА РАЗВЕРТКИ (ПЕРЕМЕННАЯ РАЗВЕРТКИ) переменная, играющая роль оси, вдоль которой развертываются данные в портрете ситуации, напр., абсцисса на графике. Одновременно играет роль генератора статистики: вдоль ее дерева координаты производится суммирование данных при вычислении статистических показателей: коэффициента корреляции, коэффициентов регрессии и др.
В начало
КООРДИНАТА СРАВНЕНИЯ (ПЕРЕМЕННАЯ СРАВНЕНИЯ) переменная, координатный интервал которой фиксирует сечение куба данных, отображаемое в портрете ситуации. Соответствует Z-оси ("глубине") трехмерного графика. Портреты, полученные при разных значениях этой переменной, сравниваются для отбора устойчивых характеристик, отсюда и название. В корреляционной матрице используется "комбинированная" переменная сравнения, составленная из двух, напр. вначале - возможные загрязнители, затем - возможные диагнозы. Она выступает в роли горизонтальной и вертикальной оси матрицы.
В начало
КООРДИНАТНОЕ ДЕРЕВО совокупность координатных интервалов, относящихся к одной и той же координате, но, возможно, разным уровням иерархии. С указанием правила включения низших интервалов в высшие и правила агрегации данных при переходе от первых ко вторым. Может включать также указание поля базы данных, соответствующего координате, и кодов данных, соответствующих каждому интервалу (напр., интервалу "Вирусная пневмония" по координате "Диагноз" соответствует код данных "480" по МКБ-9). Структура дерева координаты полностью в руках пользователя.
В начало
КООРДИНАТНЫЙ ИНТЕРВАЛ интервал числовой оси для числовых координат (напр., возраст от 10 до 20 лет) или набор значений - для логических координат (напр., совокупность CO2, NO2, SO2). Может включать координатные подынтервалы более низкого уровня иерархии. Интервалы низшего уровня, не содержащие подынтервалов, (и только они) могут заполняться данными из базы данных. Более высокие части дерева координаты заполняются путем агрегации низших интервалов. Совокупность координатных интервалов различных переменных задает фрагмент пространства переменных в форме параллелепипеда (прямого произведения одномерных интервалов). Такой параллелепипед образует "емкость" или "контейнер", в котором размещаются данные.
В начало
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ система содержит среду для экспертного анализа корреляций между данными различных блоков. Она включает обзор парных корреляций с помощью корреляционной матрицы, автоматическое определение данных, чьи корреляции удовлетворяют пользовательским критериям, визуализацию дерева вкладов в корреляцию и др. Используется для экспертного анализа связей между факторами среды и здоровья, а также для отбора факторов, включаемых в регрессионные модели.
В начало
КОРРЕЛЯЦИОННАЯ МАТРИЦА визуальное представление коэффициента корреляции между данными, лежащими в координатных интервалах разных блоков. Напр., корреляция между концентрацией загрязнителя SO2 и заболеваемостью с диагнозом "Бронхит". Строки матрицы - координатные интервалы переменной "загрязнитель", столбцы - координатные интервалы переменной "диагноз", и клетка матрицы на их пересечении дает в цветокоде коэффициент корреляции между ними. Суммирование при расчете корреляции проводится по переменной развертки, которой может быть любая общая для указанных блоков переменная (обычно, пространство и/или время). Переменные сравнения, отличные от строки и столбца, фиксированы, и их изменение дает новую матрицу. Клетки корреляционной матрицы представляют собой "светофор": "горящие" клетки привлекают внимание эксперта к взаимосвязанным факторам.
В начало
КРИТЕРИИ а) набор весов или весовых функций, служащих для объединения разнотипных переменных или блоков; б) правило, описывающее, что является оптимумом, и используемое в процессе оптимизации; в) правило или число, используемое как порог при разбиении данных по категориям (например, квантиль гистограммы - при разбиении данных на фон, горячие точки и выскакивающие значения). При работе с пакетом вариантов возможно одновременное использование нескольких критериев, например в рамках многокритериальной оптимизации.
В начало
КУБ ДАННЫХ многомерный набор ячеек, размещенный в пространстве переменных, имеющий форму параллелепипеда и заполненный данными. Оси куба, как правило, соответствуют переменным развертки и переменным сравнения, а заполнение - переменной значения. Куб является основной внутренней структурой данных системы. При считывании из базы данных данные переводятся именно в эту внутреннюю структуру. Размещается в памяти и может быть сохранен на диск и считан оттуда. Данные в кубе неявно организованы в иерархическую структуру, соответствующую уровням иерархии деревьев координат - осей. У каждого блока системы имеется 3 основных куба данных: для данных из базы данных, подключенной к блоку; для модельных прогнозов и для фона.
В начало

Л
ЛАГ сдвиг между соответствующими друг другу координатными интервалами по одной и той же переменной в разных блоках. Напр., сдвиг по времени между горячей точкой в блоке риска и вызванной ею горячей точкой в блоке заболеваемости; сдвиг в пространстве между положением источника выброса и вызванным им максимумом концентрации загрязнителя; сдвиг по возрасту между возрастной группой заболеваемости и соответствующей возрастной группой смертности.
В начало
ЛИЦО, ПРИНИМАЮЩЕЕ РЕШЕНИЯ (ЛПР), основной адресат выходной информации системы: глава муниципальной администрации, главный санитарный врач, председатель комитета по экологии и т.д. Работает с системой через своих ведомственных экспертов.
В начало

М
МКБ международный классификатор болезней. В данной работе использовался МКБ-9.
В начало
МОДЕЛЬ алгоритм преобразования данных при переходе от блока к другому блоку. Предметные модели отражают сущность процесса, который порождает причинную связь между данными. Напр., модель распространения загрязнений, связывающая данные об источнике выброса с данными о концентрациях в среде, отражает физику атмосферного переноса. Регрессионные модели строятся по неким "обучающим" данным из связываемых блоков, и затем экстраполируются на другие, "рабочие" данные. Модели используются также для переноса данных "в обратном направлении" при решении обратной задачи.
В начало
МОДЕЛЬ БАЗЫ ДАННЫХ набор установок, определяющих порядок считывания из базы данных в куб данных при создании выборки. Задает соответствие между полями БД и переменными, между кодами данных и координатными интервалами и др. Записывается в специальный файл под именем, которое может быть затем использовано в координатных деревьях при задании выборки.
В начало
МОДЕЛЬ РАСПРОСТРАНЕНИЯ ВЫБРОСА принимает в качестве входных данные блока выбросов о параметрах источника выброса и метеоданные. Выдает в блок концентраций ожидаемые концентрации в заказанных точках и в моменты времени, соответствующие метеоданным. Использует, по выбору эксперта, либо алгоритм ISC3ST, разработанный US EPA, либо алгоритм ОНД-86, разработанный в ГГО им. Воейкова. Параметры модели задают тип местности и способ использования метеоданных.
В начало
МОДЕЛЬ ЗАБОЛЕВАЕМОСТИ принимает в качестве входных данные блока рисков (риск по методике EPA для канцерогенов и риск по методике С.М.Новикова для неканцерогенов) и данные о половозрастном составе экспозиционных групп, для которых рассчитан риск. Выдает в блок заболеваемости данные об ожидаемой частоте обращаемости выбранных половозрастных групп населения по достаточно агрегированным группам диагнозов. Параметры модели устанавливают связь между уровнем риска и тяжестью эфектов для здоровья, а также лаги между воздействием на здоровье и проявлением в виде обращаемости.
В начало
МОДЕЛЬ СМЕРТНОСТИ принимает в качестве входных данные блока заболеваемости об обращаемости по тем или иным группам диагнозов. Выдает в блок смертности ожидаемую смертность, связанную с этими заболеваниями, с разбивкой по причинам смерти и с лагами по времени и возрасту. Параметры модели устанавливают динамику развития заболевания и ожидаемые сценарии миграции носителей заболевания между включенными в выборку территориями.
В начало
МОДЕЛЬ ФОРМИРОВАНИЯ РИСКА принимает в качестве входных данные блока концентраций о распределении концентраций загрязнителей во времени и пространстве, а также данные о сценариях экспозиции выбранных экспозиционных групп населения. Выдает в блок риска 3 типа рисков с разбивкой по экспозиционным группам: 1) пожизненный риск для канцерогенов, рассчитанный по методике EPA в предположении хронической экспозиции к концентрации, равной входной; 2) текущий риск для неканцерогенов по системе EPA в виде индексов опасности; 3) текущий риск по методике С.М.Новикова для неканцерогенов, позволяющий оценить ожидаемые эффекты для здоровья. Параметрами модели являются характеристики сценариев экспозиции.
В начало
МОДЕЛЬНЫЙ ПРОГНОЗ решение прямой задачи переноса данных из координатных интервалов источника в координатные интервалы приемника по некоторой модели. Напр., прогноз распространения концентрации загрязнителя во времени и пространстве от источника, согласно модели атмосферного переноса. Прогноз заболеваемости для половозрастной группы, исходя из распределения риска по экспозиционным группам. Прогноз может совершаться по любой переменной, не обязательно по времени.
В начало

Н

НЕВЯЗКА куб данных, заполненный разностью между двумя другими кубами данных той же структуры - как правило, между модельным прогнозом и соответствующими реальными данными.
В начало
НЕОПРЕДЕЛЕННОСТЬ мера изменчивости данных 1) вдоль переменной развертки (напр., внутригрупповая дисперсия); 2) вдоль переменной сравнения (напр., межгрупповая дисперсия). Может определяться по отношению к различным системам отсчета, напр., невязка - неопределенность данных относительно модельного прогноза как системы отсчета. Обобщенная характеристика неопределенности - отношение внутригрупповой и межгрупповой непределенности. К нему сводятся такие используемые в системе статистические показатели, как коэффициент корреляции, показатель тесноты регрессии, характеристики выделенности кластера и т.п.В зависимости от вида представления данных, неопределенность изображается доверительными кривыми (в регрессии), насыщенностью цвета (в корреляционной матрице) и т.п. Для объединения показателей неопределенности, относящихся к разным переменным или блокам, используются те же весовые критерии, что и для оптимизации.
В начало
НЕВИДИМЫЕ ПЕРЕМЕННЫЕ те из переменных сравнения, присутствующих в кубе данных, которые не отображаются на экран: ни строкой/столбцом таблицы, ни осью глубины графика. Пользователь выбирает фиксированный координатный интервал по таким переменным. Изменяя этот выбор, можно "сканировать" куб данных каким-либо его сечением, смещаемым вдоль невидимой переменной.
В начало

О

ОБРАТНАЯ ЗАДАЧА обращение модельного прогноза: перенос данных из координатных интервалов приемника в координатные интервалы источника в рамках той же модели, по которой осуществляется прогноз. Напр., обращение наблюдаемого пространственного распределения концентраций по модели распространения выброса с целью идентификации предприятий - источников загрязнения. Также - обращение правила агрегации: перенос данных из верхних уровней иерархии в нижние (дезагрегация), либо перенос параметров модели (точнее, поправок к ним) с верхних уровней модельной иерархии на нижние. Обратные задачи, как правило, неустойчивы, и требуется ограничить класс их возможных решений. Это делается либо указанием критериев приемлемости решения, либо предварительным решением прямой задачи для реперных ситуаций, между которыми затем ищется решение обратной задачи.
В начало
ОБСЧЕТ ВЫБОРКИ выполнение операций обработки, предусмотренных текущим режимом. Включает как операции настройки, выполняемые экспертом вручную, так и операции, выполняемые автоматически, в конвейерном режиме, на основе установленных настроек. Операции настройки включают задание установок входной и выходной информации, уточнение выборки, формирование пакета вариантов, подгонку модельных параметров на этапе обучения модели, пробные модельные прогнозы, поиск закономерностей в выборке методами регрессионного, корреляционного, кластерного или паттерн-анализа. Типичные конвейерные операции - агрегация данных внутри координатного дерева, модельные прогнозы в рабочем режиме, оценка итоговой неопределенности расчета, построение пакета выходной информации. Они проводятся последовательно от входного блока системы, установленного при задании входной информации, до выходного блока, установленного при задании выходной информации. Обсчет выборки может включать итеративные операции, такие как согласование модельных прогнозов и реальных измерений, решение обратной задачи или оптимизация. Они повторяются до выполнения заданного пользователем _критерия остановки.
В начало
ОПЕРАЦИИ ОБРАБОТКИ ИНФОРМАЦИИ последовательность операций, задающих технологию обсчета выборки. Зависит от режима обработки. Отображается на экране набором кнопок, которые включаются в соответствующей режиму последовательности. Образуют "конвейер" обработки информации. Помимо этих операций, в системе имеются операции анализа данных - регрессионного, корреляционного, кластерного, паттерн-анализа и др., которые не образуют жесткой последовательности. Они предназначены для настройки выборки и модельных параметров экспертом.
В начало
ОПТИМИЗАЦИЯ поиск экстремума одного или нескольких критериев с помощью перебора вариантов или варьирования численных параметров. Проводится методом "предсказание - уточнение". Так, оптимизация параметров модели используется при подгонке модельного прогноза под данные. Оптимизация правила агрегации проводится при решении обратной задачи, когда необходимо распределить коррекцию, сделанную для координатного интервала, по его подынтервалам. Оптимизация пакета вариантов при обсчете выборки в конвейерном режиме обычно проводится в конечной точке конвейера и сводится к выбору одного варианта и расчету меры его неопределенности. В процессе оптимизации могут создаваться новые координатные интервалы и уровни иерархии.
В начало

Предыдущий словарь Глоссарий Оглавление Следующий словарь

© ИКИ РАН, 1998-2001