сложный материал

ПРИМЕРЫ СИСТЕМ ОТСЧЕТА

EHIPS - система СРЕДА-ЗДОРОВЬЕ


   Адекватная СО необходима для сопоставления данных из разных координатных интервалов. Так, ставнение заболеваемости на разных территориях возможно только в СО «относительно численности населения территории». СО в неявном виде задает модель некоторого фонового процесса в сфере «среда-здоровье». В данном примере модель состоит в равной вероятности заболевания для всех индивидов, независимо от территории. Возможны и другие модели, задающие территориально-зависимую СО.
   Предметные или эмпирические модели, используемые в системе для связи между блоками, тоже опираются на конкретную СО. Например, модель пересчета концентрации в риск работает относительно единичной массы тела, фиксированного объема дыхания и т.д. При попытке проследить, скажем, накопление дозы для некоторой когорты с возрастом, эта СО начинает «плыть» из-за возрастного изменения вышеуказанных коэффициентов. Модель проявления рисков в заболеваемости работает в СО, где вычтена фоновая заболеваемость. При изменении фона со временем, например из-за социальных факторов, эта СО «поплывет», и могут появиться ложные горячие точки заболеваемости.
   С учетом этих моделей, СО разных блоков оказываются связаны в единую СО для опасности здоровью, связанной с загрязнением среды. Однако эта СО не жесткая: как мы видели, ее части могут в некоторых пределах меняться независимо друг от друга. Одни показатели при этом меняются, другие же остаются инвариантными. Так, территориальные горячие точки заболеваемости в первом приближени не зависят от изменения общей структуры заболеваемости по городу с изменением социально-экономических условий. Горячие точки же в половозрастном разрезе - зависят.
   Оптимизируемые системой пользовательские критерии, на основе которых устанавливаются приоритеты и вырабатываются варианты мер управления, должны зависеть только от показателей, инвариантных к допустимым изменениям СО. Допустимые изменения включают, например, перегруппировку координатных интервалов, смену уровня агрегации данных, ввод «движущихся» вдоль переменной систем отсчета, подобных вышеуказанным. По существу, инварианты характеризуют тип паттерна опасности, который складывается из данных всех блоков системы.
   Все величины, используемые в системе, не абсолютны, а определены применительно к какой-либо системе отсчета (СО). Она должна быть связана с одним из объектов СОИ. Смена состояния СО приводит к смене указанных величин, хотя то, что стоит за ними реально, не меняется. Поскольку дрейф подвижных СО нельзя проконтролировать, а жестко фиксированные СО по ряду причин неудобны, приходится считать все состояния СО равноправными и пользоваться только величинами, которые не зависят от выбора состояния СО. Такие величины называются инвариантами. В первую очередь, реальные результаты мониторинга и управления средой должны оцениваться через инварианты.
ПРИМЕРЫ СИСТЕМ ОТСЧЕТА

   Приведем несколько иллюстраций систем отсчета, используемых (в основном, неявно) в практике экологической эпидемиологии.
  1. Состояние здоровья характеризуется в первую очередь через относительный риск. Он рассчитывается как разность или отношение вероятности заболеть в исследуемой и "фоновой" группе. Последняя и играет роль системы отсчета для риска.
       Если обозначить X10 величину, характеризующую относительный риск, а через X0 и X1 - абсолютные риски соответственно в фоновой и исследуемой группе, то
          X10 = X1 - X0.
    
       Если относительный риск определяется не как разность, а как отношение, надо вместо X взять log X . Понятно, что "абсолютность" риcков X1 и X0 на самом деле относительна: они определены применительно к воображаемой системе отсчета, где никто не болеет.
       В ходе исследований, например когортных, состояние группы 1 может меняться довольно сложным образом. Идеальной системой отсчета обычно считается такая группа 0, которая "следует по пятам" за группой 1, отличаясь от нее одним фактором - экспозицией. Если же система отсчета 0 неизменна (к чему близка группа "все население"), на характеристику риска X10 влияют изменения любых факторов в группе 1. Эти мешающие факторы как бы смещают группу 1 относительно системы отсчета 0.
       Из-за этого неподвижная система отсчета неудобна. Мешающих факторов много, усилия на учет их влияния на группу 1 идут большие, а при этом сами по себе эти факторы обычно не представляют никакого интереса.
       С другой стороны, если система отсчета 0 подвижна, она, скорее всего, следует за системой 1 в какой-то мере и по экспозициям. Если этого не учитывать, расчет влияния экспозиции на величину риска X10 получится искаженным.
       Однако надо учесть, что и сама экспозиция Q - величина не абсолютная, а определенная применительно к той же системе отсчета 0, так что
             Q10 = Q1 - Q0.
    
       Поэтому возможна такая удачная ситуация, когда и X , и Q оба дрейфуют вместе с системой отсчета 0, но их зависимость F (X=F(Q)) остается постоянной. Такие зависимости называются ковариантными к смене системы отсчета.
       Пусть нас интересуют, например, линейные зависимости X = a Q + b . Легко видеть, что при b = 0 (нулевой риск при нулевой экспозиции) эти зависимости ковариантны при любом a. Если в определении относительного риска взять отношение, а не разность, и аналогично для экспозиции, то, проводя то же рассуждение для log X и log Q, получим, что ковариантны уже зависимости вида log X = a log Q, т.е. X должен быть связан с Q степенной зависимостью. Но по-прежнему нулевой риск получается при нулевой экспозиции.
       Для зависимостей более сложной формы последнее свойство выполняется только в некоторых системах отсчета. Те СО, где это верно, естественно, по аналогии с физикой, назвать инерциальными (без действующей причины нет эффекта).
  2. Рассмотрим популяцию, разбитую на несколько возрастных групп с индексом i. Обозначим число смертей в i-й группе, насчитывающей p(i) индивидов, через d(i), а соответствующие полные числа для популяции - через d и p . Единственная разумная характеристика смертности, определенная для популяции КАК ЦЕЛОГО,- это d / p.
       Естественно перенести эту характеристику и уровнем ниже по иерархии - на отдельную возрастную группу. Получим для нее d(i) / p(i) . Как из таких характеристик складывается общая характеристика популяции? В линейном приближении, популяция их усредняет (усреднение по i обозначаем S) и превращает в S d(i)/p(i) = S [d(i)/p] / [p(i)/p]. Заметим, что это не то же самое, что d / p = S d(i) / S p(i) = S [d(i)/p] / S [p(i)/p]. Это отражает разницу в системах отсчета верхнего и нижнего уровня.
       Роль системы отсчета для верхнего уровня играет распределение вероятности, сосредоточенное в точке с весом p. Роль системы отсчета для нижнего уровня играет распределение вероятности для i с весами p(i) (точнее, p(i)/p ). Как видно, система отсчета связана с самой исследуемой популяцией. Для сравнимости между популяциями, надо отнести результаты к СО, связанной с некоторой стандартной популяцией. Обозначим ее распределение вероятности по группам P(i) (точнее, P(i) / P). Тогда получим одну из известных форм стандартизованной смертности:
        S [d(i)/p] / [P(i)/P]. 
    

       Характерно, что СО определяется именно через распределение вероятности.
  3. Для характеристики нераковых рисков обычно используется отношение полученной дозы токсиканта к некоторой пороговой дозе. Эта величина не связана напрямую с вероятностью заболеть. Тем не менее, в американском подходе к риску для практических целей такую связь устанавливают, хоть и неявно, через поддерживаемую EPA систему правил принятия решений по управлению опасностями. Любая такая связь эквивалентна выбору какой-то системы отсчета для нераковых рисков.
       Исходная система отсчета, связана с пороговой дозой, которую обозначим e(i) (i нумерует токсиканты). Если через d(i) обозначить полученные дозы, то общий индекс для некоторого заранее заданного заболевания будет S d(i)/e(i).
       Для разных заболеваний индекс одинаков, но вероятности заболеть, естественно, разные. Это подсказывает, по аналогии с примером 2, где используется такая же формула, что надо рассмотреть возможные изменения СО так, чтобы представить равенство расчетных индексов как результат измерения в своей СО для каждого заболевания. Пусть новая СО описывается через новые пороговые дозы E(i) и E = S E(i), e = S e(i). Тогда нераковый риск надо пересчитывать как
        S [d(i)/e] / [E(i)/E].
    

       Одна из таких СО позволяет воспроизвести оценку риска для раковых заболеваний, связанных с теми же загрязнителями. Это возможно потому, что, хотя для нераковых заболеваний и предполагается пороговый механизм, вышеприведенная формула содержит линейную зависимость от дозы, такую же, как при канцерогенном механизме формирования риска.
       Таким образом, подходящим выбором СО можно связать раковые и нераковые риски. Эта СО - пересечение траектории изменений СО, оставляющих инвариантными раковые риски, с аналогичной траекторией, оставляющей инвариантными нераковые риски. Чтобы пересчитать первые во вторые, надо дойти из исходной СО до этой точки по "нераковой" траектории, а потом возвращаться из нее по "раковой" траектории.
  4. Аналогичная примеру 3 ситуация возникает при управлении средой через нормативы для концентраций, например через ПДК. ПДК формируют систему отсчета: для управления играет роль не абсолютная величина загрязнения, а то, во сколько раз оно больше ПДК.
  5. Во многих случаях объективные измерения сравниваются с субъективными показателями, которые устанавливают, что считается нормой. Если обозначить первые через d(i), а вторые - через e(i), возвращаемся к знакомой формуле. Естественно, нормы образуют СО.
       Например, индекс здоровья популяции использует показатели заболеваемости и смертности "в норме". Однако в одних случаях эта норма - по определению ВОЗ, "полное благополучие", а в других - "как было вчера", что не одно и то же. Смена СО вызывает вполне реальную смену общественной реакции на ущербы здоровью. Тем не менее ,принцип инвариантности все же соблюдается; его можно выразить формулой "сколько готовы платить, на столько можете и тревожиться". Характерно, что этот принцип соединяет "мониторинг" ситуации и управление ею (затраты).
  6. Того же типа - нормы дисконтирования, которые устанавливают, во сколько раз завтрашние затраты и выигрыши менее существенны, чем сегодняшние. Естественно, схема дисконта субъективна и специфична для каждой организации. Если обозначить момент времени через i, коэффициент дисконта через e(i), а выигрыши или потери - через d(i), опять получаем ту же формулу.
  7. При оптимизации планов мониторинга существенна система отсчета для цены получаемой информации. Она определяет, какая информация условно считается бесплатной (например, та, которая и так собирается за государственный счет).
   Следует подчеркнуть, что в линейном случае и если не происходит переходов между уровнями агрегирования информации, СО всегда "инерциальны" и их учет ничего нового не дает.
Математический подход к системам отсчета

   Статистические методы, которые используются в экологической эпидемиологии, уже содержат СО в явной или неявной форме. Например, в байесовом подходе к оценке наблюдений и принятию решений СО для возможных исходов i задается т. наз. априорным распределением вероятности P(i). При получении наблюдения СО пересчитывается таким образом, что распределение "подтягивается" к наблюдению. Т.е. имеем СО, дрейфующую вслед за наблюдением, как в примере 1. Если наблюдения происходят из статистически однородной выборки, СО в конце концов становится вероятностным пиком, центрированным на i. В понятиях примера 2 это можно интерпретировать как совпадение СО нижнего уровня с СО более высокого уровня.
   Байесов подход важен с двух точек зрения. Во-первых, к нему сводится большая часть статистических процедур, употребляемых при неподвижной СО выборки: регрессия, дисперсионный анализ и т.д. Если же выборка "дрейфует", байесов подход превращается в метод Калмана для адаптации модельной СО к наблюдениям.
Во-вторых, в байесовом подходе легко учитываются экономические факторы - ущербы и потери z(i), связанные с каждым решением i. Они просто меняют СО с P(i) на P(i)z(i).
   В традиционном байесовом подходе СО меняется плавно. Но есть ситуации, когда должен происходить скачок от старой СО к новой. Это типично для возникновения нового подобъекта.
Пример скачка системы отсчета
(807 x 748, 9 K)
На рис. пунктиром обозначено распределение - СО: вверху - для исходного объекта, внизу - для подобъектов, которые в нем созданы. Сплошная линия - распределение значений в реальной исследуемой выборке. В примере 2 для подобного случая было рассмотрено правило пересчета наблюдений от СО, связанной с подобъектами, к СО, связанной с объединяющим их объектом.
   Пересчет СО нужен как для правильного расчета рисков, соответствующих наблюдениям относительно дрейфующих СО (это задача мониторинга), так и для правильного управления при дрейфе СО, связанной с желаемым либо нормативным распределением вероятности состояний управляемой системы.
   Качество исходных данных мониторинга также оценивается применительно к конкретной СО, соответствующей решаемой задаче. Известный в статистике показатель качества - т.наз. информация Фишера, заключенная в единичном наблюдении по отношению к некоторому искомому фактору.
   Чтобы преобразование СО не нарушало функционирования СОИ, надо, чтобы все методы и правила модельных объектов были ковариантны к изменению СО. Это значит, что если произвести преобразование СО над "входом" метода, и затем применить метод, получится то же самое, как если сначала применить метод, а потом произвести указанное преобразование над его выходом.
Использование смены систем отсчета

   Есть два основных способа конструктивного использования СО.    Эти возможности можно использовать по-разному.
  1. Разные социальные группы используют разные СО для оценки ущерба здоровью. Меры же по снижению ущерба часто затрагивают всех одинаково. Можно привести все группы к единой "коллективной" системе отсчета примерно так, как сделано в примере 2, и для нее рассчитать единую стратегию управления средой. Обратное же преобразование провести на этапе управления. В этом случае от групп с меньшей самооценкой ущерба потребуются и меньшие расчетные усилия по управлению. Это можно выразить так: "кому меньше нужно, тот меньше платит". Этот алгоритм возможен из-за дуальности мониторинга и управления.
  2. Удобно не учитывать фоновые потери, в т.ч. государственные расходы на мониторинг, т.к. иначе потребуется учесть массу сложных факторов. Но если этот фон меняется по территориям, СО будет дрейфовать. Это увеличит неопределенность соответственно кривизне траектории дрейфа в пространстве состояний СО. Поскольку информация для снятия этой неопределенности имеет свою цену, может оказаться выгоднее учесть фоновые потери в явном виде. Это можно выразить так: при правильном управлении выгодно экономить даже как бы бесплатные ресурсы.
  3. Если представить непрямое управление ("информационное управление", "управление через ожидания") как воздействие на систему отсчета управляемого объекта, то далее по информационному циклу можно найти прямое управление, эквивалентное этой смене СО. Преимущество прямого управления в том, что его можно оптимизировать.
  4. Выбор когорты, относительно которой рассчитываются избыточные риски, влияет на решение о необходимости каких-либо мер со стороны ЛПР. То же касается других подобных выборов СО, которые обсуждались выше. Чтобы нейтрализовать этот эффект, можно ввести "плату" за выбор той или иной фоновой когорты и т.п. Эта плата должна вычитаться из расчетных ресурсов, доступных для осуществления какого-либо плана мер.
       Для этого надо типизировать картину состояния здоровья в разных когортах - найти устойчивые паттерны состояния здоровья. Каждый из них можно брать в качестве СО за "плату", равную расчетной цене перевода когорты в это состояние из некоего базового состояния. Так сказать, чтобы оценивать свое здоровье по стандартам ВОЗ, надо заплатить за реализацию этих стандартов.
  5. Если представить токсикологические и эпидемиологические оценки как один и тот же риск, только измеренный относительно разных СО, можно было бы сочетать в системе оба этих ценных источника информации.

Оглавление

© ИКИ РАН, 1998-2001