В основе почти всех алгоритмов лежат методы оптимизации пользовательских или встроенных критериев. Оптимизатор, как правило, использует пару взаимосвязанных критериев, один из которых работает с переменной значения, а другой - с переменной развертки или сравнения. Напр., первый критерий характеризует точность модельного прогноза, а другой - устойчивость. Второй критерий обеспечивает регуляризацию оценок.
В ходе оптимизации производится расчет меры неопределенности найденного оптимума (фактически, чувствительности экстремума к оптимизируемым параметрам).
Для числовых переменных, как правило, оба критерия - та или иная форма расстояния. Поскольку они квадратичны, в оптимизаторе используется эффективный рекуррентный алгоритм, основанный на методе Ньютона. Для нечисловых переменных либо используется тот же подход с числом координатных интервалов выбранного уровня как мерой расстояния, либо применяется т.наз. генетический алгоритм стохастического поиска, не опирающийся на какие-либо меры расстояния.
Поясним работу генетического алгоритма на примере оптимизации структуры пакета вариантов.
Шаги алгоритма следующие.
Расчет значения критерия оптимальности и меры неопределенности для каждого варианта.
Слияние вариантов, различие которых меньше меры неопределенности.
Расщепление вариантов, у которых профиль оптимума удовлетворяет критерию выделения подгрупп.
Порождение новых, "скрещенных" вариантов обменом координатных интервалов между случайно выбранными вариантами - "родителями".
Удаление вариантов, наихудших по критерию оптимальности с тем, чтобы полное число вариантов в пакете оставалось постоянным.
Работа большей части алгоритмов, таких как выделение подгрупп, подгонка моделей и данных, обратная задача идентификации источников и др., фактически сводится к применению методов оптимизации со специфическими для алгоритма критериями. Поэтому остановимся подробнее на алгоритмах, которые не сводятся только к оптимизации.
При корреляционном анализе для пары координат, напр. "загрязнитель - диагноз", рассчитывается парный коэффициент корреляции для каждого координатного интервала по одной и другой координате, напр. SO2-астма, и с усреднением по координатам развертки, обычно - по времени и пространству. Возможно также вычисление частных корреляций с фиксацией значения какого-либо третьего координатного интервала. Это нужно для проверки корреляций на устойчивость и наличие мешающих факторов. Кроме того, строится дерево вкладов в корреляцию и по нему выделяются подгруппы с наибольшим вкладом для последующего анализа более тонкими регрессионными методами.
При регрессионном анализе проводится пошаговая многофакторная квазилинейная регрессия, которая сводится к оптимизации отношения полной к остаточной дисперсии. Выбор базисных функций для регрессии производится пользователем. Определение набора координатных интервалов, переменные значения в которых служат аргументами регрессионной функции, производится по максимуму корреляции с переменной отклика регрессионой функции, до достижения заданного пользователем порога по числу аргументов и коэффициенту корреляции.
При паттерн-анализе находится устойчивый рисунок изменения переменной значения вдоль переменных развертки, лежащий в заданном классе функций. Это могут быть те же функции, что используются в качестве базисных при регрессии, либо они могут порождаться предметной моделью. Паттерн строится как среднее по переменной сравнения. Подгонка его к базовой модели производится методами оптимизации, однако этот процесс включает также управляемое экспертом расслоение переменных развертки и сравнения на группы, внутри каждой из которых - свой паттерн. Эта операция проводится для достижения наибольшей выразительности паттерна и порождает, вообще говоря, иерархические паттерны. Найденный паттерн может применяться как фон или как элемент портрета ситуации.