Словарь

сложный материал

КРИТЕРИИ

EHIPS - система СРЕДА-ЗДОРОВЬЕ


   Критерий - это функция, измеряющая ценность или качество каких-либо данных. В разных критериях эта функция относится к разным аспектам данных и по-разному рассчитывается. Вся автоматическая обработка ориентирована на оптимизацию установленных пользователем критериев.
Панель задания критериев

  1. Критерии согласия. Измеряют рассогласование между двумя идентично структурированными наборами данных.
    Это могут быть:    Критериальная функция формируется так: в каждом координатном интервале рассчитывается невязка - разность или отношение сравниваемых данных. Затем результат агрегируется по переменным развертки, например берется средняя невязка. При этом могут использоваться разные веса для разных переменных. Веса тоже составляют часть критерия.
       В результате получается значение критерия как функция зафиксированных при расчете параметров-аргументов: значений переменных сравнения или модельных параметров (если в сравниваемые данные входил модельный прогноз). Меняя аргументы, можно оптимизировать согласие между сравниваемыми данными.
       Типичная критериальная функция согласия - среднеквадратичное отклонение: невязка в виде квадрата разности, агрегация - усреднение. При вводе весов, связанных с дисперсией переменной значения, можно получить другую критериальную функцию - коэффициент корреляции между данными. Эти и другие стандартные критерии предоставляются пользователю для выбора. Для всех операций автоматического обсчета выборки, включающих оценку результата и/или оптимизацию, заранее подобраны наиболее подходящие критерии (см. ниже).
       Каждая переменная развертки - не линия, а координатное дерево. Поэтому критерий может включать весовые коэффициенты для каждого уровня иерархии.
  2. Критерии оптимальности. Отличаются от критериев согласия тем, что работают с единственным набором данных, а не с парой. Впрочем, этот набор может включать несколько разных кубов данных. Вместо невязки используется какая-либо мера оптимальности, универсальная для всех координатных интервалов. Например, когда ищется максимум, эта мера равна переменной значения, а когда минимум - берется с обратным знаком.
       В задаче установления приоритетов искомый "оптимум" - это максимальная опасность. Вклад в нее каждого блока определяется переменной значения и своим весовым коэффициентом. Наоборот, в обратной задаче оптимального распределения нагрузок между источниками загрязнения ищется минимум опасности. Оптимизация обычно проводится не подгонкой аргументов критериальной функции, а отбором оптимального варианта из пакета вариантов (в первом случае) либо подгонкой весовых коэффициентов (во втором случае).
  3. Критерии близости. Используются для отнесения координатного интервала к той или иной группе интервалов. Это необходимо, например, при определении горячих точек, в методах выделения кластеров и др. Как правило, используется понятие "расстояния" между парой координатных интервалов, аналогичное понятию невязки в критериях согласия. Однако оно совсем по-другому агрегируется: с учетом только ближайших "соседей" в координатном дереве.
       В отличие от двух вышеуказанных критериев, критерии близости принципиально двухуровневые: верхний уровень - все данные, нижний - соседи данного координатного интервала. Кроме того, при оптимизации критериальной функции манипулируют не аргументами или весами, а составом набора данных, на котором она рассчитывается - составом выделенной группы.
       Используется также "межуровневое" расстояние: между отдельным координатным интервалом и группой интервалов. Критерии близости этого типа используются для отделения горячих точек и выскакивающих значений от фона. При этом расстояние измеряется квантилями общей гистограммы данных. При превышении точкой данных заданного квантиля она отделяется от "общей массы".

Оглавление

© ИКИ РАН, 1998-2001