СРАВНЕНИЕДВУХ АЛЬТЕРНАТИВНЫХ МОДЕЛЕЙ РАСЧЕТА ВЫБРОСОВ ЗАГРЯЗНЯЮЩИХ ВЕЩЕСТВ И ФАКТИЧЕСКИХ ДАННЫХ В СИСТЕМЕ ОБРАБОТКИ ИНФОРМАЦИИ "СРЕДА-ЗДОРОВЬЕ" (EHIPS)

БОРИС БАЛТЕР, МАРИЯ СТАЛЬНАЯ, ВИКТОР ЕГОРОВ

Институт Космических Исследований, Российская Академия Наук
Профсоюзная ул. 84/32,
Москва, 117810,
Россия

В статье представлены результаты моделирования выбросов загрязняющих веществ в окружающую среду с использованием программы EHIPS, разработанной для расчетов связи загрязнения окружающей среды и здоровья населения. Начнем с общего описания системы, затем перейдем к рассмотрению блока моделирования, который использует две стандартные модели расчета дисперсии - российскую (ОНД-86) и американскую (ISC3ST). Особенность этого модуля - связи с другими компонентам системы, которые открывают путь к многократному использованию результатов моделирования, включая простое сравнение между модельными расчетами и результатами фактических измерений.

Сравнивать модельные данные и результаты фактических измерений будем на годичном наборе данных, полученных в индустриальном городе (Череповец, РФ). В общем, совпадение трех вышеуказанных видов данных получается удовлетворительным. Нас интересует, прежде всего, анализ зависимости расхождений между моделями и между модельными и реальными данными, в зависимости отзагрязняющего вещества, времени, и т.д. Мы также обсудим влияние неточностей информации об источниках выбросов на точность модельных данных. Приводятся также попытки интерпретировать оценки риска, полученные в результате моделирования.

Что такое EHIPS?

EHIPS - программное обеспечение, обрабатывающее данные и вычислительные модели, связанные с химическим загрязнением окружающей среды и состоянием здоровья населения.
Основные особенности:

В перспективе, EHIPS будет также: Основные пользователи EHIPS - официальные организации, имеющие право контролировать состояние окружающей среды и здоровья населения: Санэпиднадзор, комитеты по экологии и муниципальная администрация. Основные направления использования EHIPS для них:

Какие проблемы решает EHIPS?

Существует много программного обеспечения для анализа загрязнения окружающей среды: моделирование расчет дисперсии загрязняющего вещества, вычисление рисков здоровью населения, поддержка эпидемиологических исследований окружающей среды и т.д. Однако, каждое программное обеспечение направлено на один определенный аспект обработки данных. Напротив, EHIPS был разработан для связи этих аспектов и создания конвейера вычислений, который использует анализ данных в одном модуле, чтобы улучшить результаты расчетов в другом модуле. Этот универсализм может помочь в решении следующих проблем.

Обычно, программное обеспечение, созданное для административных целей (например, проверка выполнения нормативов на концентрацию) использует некоторый фиксированный алгоритм для вычисления концентраций и рисков, заполнения пробелов в данных и так далее. Однако, проблемы окружающей среды научно сложны и обычно нуждаются в вычислительных экспериментировах и подгонке данных для получения удовлетворительных результатов. Такой научный анализ обеспечивается совершенно иным программным обеспечением (если вообще проводится). EHIPS же синтезирует конвейер вычислений по фиксированному алгоритму и научный анализ. Последний задает значения параметров для первого, проверяет осмысленность его результатов и, в случае необходимости, адаптирует параметры далее.

EHIPS не требует создания специальных систем наблюдения среды или злоровья. Программа ориентирована на стандартные базы данных, которые существуют в России: по выбросу загрязняющего вещества, измеренным концентрациям, заболеваемости, смертности и т.д. Такие данные обычно лежат мертвым грузом или используются очень поверхностно, потому что прежде, чем их можно действительно использовать, их нужно многократно проверить, скомпоновать с другими данными, адаптировать к решаемой задаче. EHIPS может оживить такие данные, вобрав их в себя через гибкий интерфейс, проверенный на нескольких десятках типов баз данных России. Через этот интерфейс данные импортируются в универсальный конвейер обработки и становятся активными участниками решения любой задачи.

Все типы данных, упомянутые выше, имеют общий набор основных операций:

Универсальные статистические пакеты анализа поддерживают такие операции для любого типа данных, но они не содержат никакого специфического механизма вычислений для окружающей среды. Напротив, пакеты, ориентируемые на окружающую среду, обычно ограничены специфическими типами данных. Так, например, картографические операции, проводимые над контурами концентрации, не переносятся автоматически настатистику заболеваемости. EHIPS стандартизирует обработку разных типов данных вложением каждого из них в 'пространство данных', имеющее следующие оси: Каждая ось организована иерархически. Все диаграммы, карты, статистики, и т.д. независимы от выбора осей пространства данных. Таким образом, EHIPS - потенциальный стандартизующий инструмент для анализаокружающей среды.

Обычно, программное обеспечение, ориентированное на анализ загрязнения окружающей среды, использует или результаты прямых измерений, или результаты компьютерного моделирования, но не оба одновременно. Однако, желательно было бы использовать оба источника информации для взаимной проверки и корректировки. Реализуя такой режим, EHIPS обеспечивает проверяемость результатов.

Состояние разработки EHIPS

Разработка EHIPS была начата в 1995 году группой экологического моделирования Института космических исследований, РАН (Москва). В 1996 - 1997 работа была продолжена той же самой группой и некоторым дополнительным персоналом в рамках Проекта управления окружающей средой РФ, и в 1997 - 2001 снова Институтом Космических Исследований.

В результате возникло три варианта конфигурации EHIPS:

Первая конфигурация в основном готова к установке, третья существует только в виде проектного документа, а для второй часть работы была выполнена, часть - нет. EHIPS еще должна пройти необходимое тестирование и лицензирование.

Функции

Основные функции EHIPS.

В отличие от вышеперечисленных функций, построение моделии установка ее параметров относится к исследовательской ветви EHIPS. Оно включает эмпирические модели, например регрессию, физические модели, например для распространения загрязнения, и модели, которые воплощают экспертное суждение, например, модели формирования риска и модели проявления риска в заболеваемости. Все эти типы моделей работают единым образом: модельные предсказания сравниваются с фактическими данными, и параметры модели получаются из наилучшей подгонки. Это может быть делаться автоматически или экспертами. Модели используются для генерации 'симулированных' данных, которые затем перерабатываются в горячие точки, приоритеты, и т.д. Некоторые результаты модельных расчетов (например, пары сильно коррелированных индикаторов загрязнения окружающей среды и индикаторов здоровья) - являются готовой выходной информацией для лиц, принимающих решение, так как помогают в идентификации опасности.

Расчет неопределенности - вспомогательная функция, которая присутствует на всех стадиях обработки данных. Она включает все источники неопределенности: статистические вариации, модельную погрешность, ошибки в данных, и т.д. В итоге получаем показатель качествавыходной информации EHIPS.

Исходные данные

Следующие базы данных должны быть в наличии для рассматриваемой территории и содержать данные, по крайней мере, в течение одного года.

В минимальной конфигурации EHIPS, некоторые из этих баз данных могут отсутствовать и заменяться модельными вычислениями.

Следующие дополнительные базы данных должны присутствовать в максимальной конфигурации:

Источники данных EHIPS показаны на рисунке 1.

Рисунок 1. Исходные данные и потоки данных в EHIPS. Серые квадраты: данные федерального уровня; белые квадраты внутри: данные регионального уровня. Прямоугольники, выделенные полужирным - основные модули расчета, каждый специализирован по одному типу данных. Они образуют конвейер обработки информации. В пределах каждого модуля перечислены переменные, по которым развернуты данные в модуле. Внизу: формы вывода результата.

Структура EHIPS

EHIPS состоит из последовательно расположенных модулей, по одному для каждого типа данных. В настоящее время имеются 5 модулей: выбросы, концентрации, риски, заболеваемость и смертность. Полная структура EHIPS будет включать также модули для индексов потерь здоровья, соответствующих экономических потерь, расчета критериев стоимость / эффективность, выбора мер управления, плана реализации выбранных мер управления, параметров тех технологических процессов, которые ведут к выбросу загрязняющего вещества.

Базовый, идущий по умолчанию процесс обработки данных состоит в обмене информацией между модулями. Обычно данные проходят через модули последовательно (например, от выброса к концентрациям загрязняющего вещества через модель дисперсии; от концентраций к риску через модель экспозиции, и т.д.). Внутри модуля модельные вычисления согласовываются с реальными измерениями из баз данных, связанных с модулем, и затем результаты передаются далее. В полном варианте EHIPS этот процесс доходит до модуля выбора мер управления выбросами и затем начинается с новыми выбросами. Таким образом, цикл замыкается и повторяется до тех пор, пока не достигнуто устойчивое состояние плана управления и соответствующего ему развития управляемой опасности.

На базе этого процесса EHIPS выполняет функции, описанные выше. Они реализуются функциональными блоками, которые работают со всеми модулями на равных основаниях. Это блок обзора данных, который выполняет сведение в таблицу, составление графиков и диаграмм, картирование; статистический блок, который выполняет корреляцию, регрессию, кластерный и паттерн-анализ и так далее.

Кроме того, EHIPS включает вспомогательные модули, которые обеспечивают связь с базами данных, формируют выходные отчетные документы, поддерживают сетевой обмен данными, и т.д.

Базовая структура EHIPS в минимальной конфигурации показана на рисунке 1. Информационный поток в максимальной конфигурации EHIPS показан на рисунке 2.

Блок моделей распространения выброса в EHIPS

Дисперсионная модель в минимальной версии EHIPS включает только распространение выброса в воздухе (см. верхнюю левую часть рисунка 1). Это только малая часть полного потока данных. Однако она важна, так как основана на хорошо известном физическом процессе. Поэтому она должна служить методологическим стандартом для валидации модели.

Мы используем две равноправных модели дисперсии выброса: ISC3ST, разработанная Агентством по охране окружающей среды США (EPA), и ОНД-86, разработанная российской Главной геофизической обсерваторией им. Воейкова (ГГО). Обе модели используются в административных целях в странах их разработки. Существует множество незначительных отличий в научном подходе между этими моделями; главное отличие - то, что ISC изначально использует гауссово приближение для профиля факела, в то время как в ОНД оно появляется постфактум, после приведения дифференциальных уравнений распространения к алгебраической форме.

Общая структура обоих алгоритмов одинакова и показана на рисунке 3.

Рисунок 2. Поток обработки информации в EHIPS.

Главная практическая проблема- то, что ОНД направлена на вычисление абсолютных максимумов концентрации при самых плохих метеорологических условиях, в то время как, ISC может предсказывать концентрации для любой текущей метеорологической обстановки и, следовательно, более пригодна для краткосрочного текущего контроля и прогноза. Однако указанное ограничение не встроено жестко в алгоритм ОНД, и мы расширили его, используя первоначальное описание уравнений ОНД так, чтобы две модели можно было сравнить при прочих равных условиях. Однако остались расхождения между двумя моделями в интерпретациииндекса атмосферной устойчивости, и это приводит к тому, что результаты могут расходиться в 2 - 3 раза. Поэтому мы уделяли наибольшее внимание не абсолютным значениям, а паттернам - рисункам поведения модельных предсказаний во времени, пространстве, и по другим "развертываемым переменным".

Рисунок 3. Параметризация и структуры информационного потока, общие для ISC и ОНД. Толщина стрелки показывает относительный вес зависимости между параметрами, которые она соединяет.

Результаты моделирования

На следующих рисунках представлен пример цветокодированных концентраций, рассчитанных на сетке квадратных ячеек, которые покрывают жилую область города Череповец. Расшифровка цветовых кодов находится в верхней шкале. Малые иконки в верхнем левом углу сетки представляют источники выброса в пределах самого большого предприятия в городе: сталеплавильного завода Северсталь. Однако там существуют также и другие источники эмиссии, которые могут оказывать значительное влияние на расчеты (по крайней мере для некоторых расположений и некоторых загрязняющих веществ). Кроме того, объем выброса брался из ежегодных отчетов, а не из фактических измерений на трубе. Все это порождает значительную неопределенность данных об источниках выброса. Следовательно, сравнение модели с измеренными концентрациями должно проводиться с осторожностью.
Годовые средние модельные концентрации NO2рассчитанные для метеоусловий, соответствующих времени ежедневных 4-кратных замеров.
Рисунок 4. ISC3ST Рисунок 5. ОНД-86

Видно, что абсолютные значения отличаются приблизительно в 2 раза, но имеется очевидное подобие в пространственной структуре. Наиболее важная особенность - горячая точка в стороне от 'основного потока' выброса - в северном жилом районе (более явная в ОНД). Ее обнаружение важно для целей регулирования загрязнения среды. Кроме того, оно соотносится с более высокими концентрациями, измеренными в этом районе.

Сравнения

Для сравнения между двумя моделями или между моделями и данными используем табличные / графические модули EHIPS, в которые подаются данные из модуля концентрации. Набор концентраций (из одной модели) выбран как система отсчета для другого подобного набора (из другой модели или из фактических данных). Строится график или гистограмма относительно этой системы отсчета по времени, или по другой переменной развертки. В результате получаем обзор различий между моделями или между моделью и фактическими данными. Некоторые примеры показаны на рисунках 6 - 11. (Мы также провели некоторую фильтрацию, чтобы удалить предполагаемые выскакивающие значения). В этих вычислениях мы использовали ISC3ST. Диапазон значений отношения реальных концентраций к модельным - примерно 0.1 - 10.

Для большинства загрязняющих веществ, модельные концентрации значительно ниже измеряемых. Это частично связано с неполнотой списка источников загрязнения. Мы можем прояснить причины различий, разворачивая отношение модельные / реальные данные по времени, так как различные источники ведут себя по-разному во временном диапазоне.

Для NO2 летом модель почти точна (отношение близко к 1), и зимой значительно недооценивает концентрации. Это происходит, вероятно, из-за того, что ТЭЦ и котельные, не учитываемые в модели, не работают летом, а зимой они - главный источник NO2 .

Для СО модели недооценивают концентрации, не имея очевидной сезонной динамики. Это происходит из-за того, что главным источником CO является транспорт (не учитываемый в модели), который не имеет явной сезонной зависимости.

Для пыли модель в среднем была почти точна. Это и ожидалось, так как главным источником пыли являются промышленные предприятия. Были случаи, когда измеряемые концентрации были меньше моделируемых. Одно из возможных объяснений этого - в изменении интенсивности выброса (временные уменьшения).

Как пример способов представления данных, дадим то же соотношение, усредненное по целому городскому району, не в виде гистограммы, а в виде ранжировки. Таким образом, мы сможем быстро идентифицировать самые большие расхождения, чтобы исследовать их подробно.
Отношение моделируемой концентрации к фактическим данным (X-ось). Годовая гистограмма 4-х разовых ежедневных замеров (Y-ось: случаев в год). Ежемесячный ряд данных для того же самого отношения (Y-ось). Используемая фильтрация была такая же как в гистограмме.

Рисунок 6. СО

Рисунок 7.

Рисунок 8. NO2

Рисунок 9.

Рисунок 10. Пыль

Рисунок 11.

Рисунок 12. Отношение NO2 моделируемых концентраций к измеряемым данным, усредненным по одному району (Y-ось). Ежемесячные средние отношений, рассчитанных для 4х разовых ежедневных замеров.

Рисунок 13. Отношение моделируемых концентраций NO2 к измеряемым данным (Y-ось), усредненным поодному району (помесячное ранжирование отношений, рассчитанныхдля 4х разовых ежедневных замеров). X-ось: дни соответственного месяца, ранжированные так, что самое высокое отношение концентраций идет первым.

Другим направлением исследований было сравнение ISC и ОНД. Как показано на рис. 12, для NO2 модели дают сравнимые результаты 'в среднем', но локальные расхождения примерно в 2 раза являются обычными. Это происходит прежде всего из-за чувствительности результатов к деталям моделирования, когда ячейка моделирования находится на хвосте факела. Как показано на рисунке 5, пространственные структуры - те же самые для обеих моделей.

Использование результатов

Основное использование модельных концентраций в EHIPS - для оценки риска здоровья населения. Мы прежде всего интересуемся неканцерогенными рисками, для которых стандартные схемы расчета риска не обеспечивают хорошую оценку. EHIPS использует для этого специальную модель риска, разработанную профессором С.М. Новиковом. Она объединяет все рассчитываемые неканцерогенные загрязняющие вещества. Возникающая в результате карта риска показана на рисунке 14. Она откалибрована так, чтобы нулевой риск соответствовал, грубо говоря, ненаблюдаемым значениям, а риск, равный 1, - смертельному исходу. Как показано в гистограмме суточных рисков (рисунок 15), главная составляющая риска связана с пылью, которая, как известно, коррелирует с полной смертностью.

Заметим, что из-за перекрытия пространственных структур, которые различаются для различных загрязняющих веществ, картина риска несколько отличается от показанной на рисунке 5 и т.д. Северная горячая точка приняла форму удлиненного 'хребта концентрации '.
Рисунок 14. Неканцерогенный риск, отображаемый на плане города: годовое среднее суточных значений, рассчитанных по ISC3ST. Вверху: цветная шкала относительного индекса риска. Цветные квадраты: ячейки сетки вычисления. Квадратные иконки: источники эмиссии, показывают тип источника. Черные квадраты: индустриальные здания. Рисунок 15. Неканцерогенный риск: годовые гистограммы суточных значений риска (X-ось), рассчитанных по ISC3ST. Y-ось: ежегодная частота суточных значений риска.

Обсуждение

Можно сделать следующие предварительные заключения из экспериментов по моделированию с помощью EHIPS.

  1. ОНД и ISC дают сравнимые годовые средние, но могут различаться в 2 - 3 раза для отдельных точек или моментов времени. Обе модели могут использоваться одновременно для взаимной проверки.
  2. Даже если модели значительно недооценивают фактические концентрации, они могут давать правильные пространственные и временные паттерны. Следовательно, они могут быть подогнаны кзначениям реальных измерений, как "интерполяция" между редкими точками измерения.
  3. Могут быть устойчивые горячие точки в неожиданных местах, и модельные риски даже в смежных ячейках моделирования могут отличиться в 2 раза.

Контакты

Для дополнительной информации и получения документации обращайтесь в группу разработчиков EHIPS:

Балтер Борис Михаилович: (495) 333-4467 ehips@yandex.ru

Егоров Виктор Валентинович: (495) 333-3589 ehips@yandex.ru

Ссылки

Страница EHIPS в Интернете: http://www.iki.rssi.ru/ehips/welcome.htm