Таблицы времен жизни. Наиболее естественным способом описания выживаемости в выборке - построение таблиц времен жизни. Техника таблиц времен жизни - один из старейших методов анализа данных о выживаемости (времен отказов) (см., например, работы Berkson and Gage, 1950; Cutler and Ederer, 1958; Gehan, 1969). Такую таблицу можно рассматривать как "расширенную" таблицу частот. Область возможных времен наступления критических событий (смертей, отказов и др.) разбивается на некоторое число интервалов. Для каждого интервала вычисляется число объектов, которые в начале рассматриваемого интервала были "живы" и число объектов, которые "умерли" в данном интервале. Вычисляются относительные доли этих объектов. Также вычисляется число объектов, которые были изъяты или цензурированы на каждом интервале.
На основании этих величин вычисляются
некоторые дополнительные статистики. Подробнее
см. в разделе Анализ
выживаемости.
Таблицы
многомерных откликов. Таблицы многомерных
откликов - это таблицы сопряженности,
которые используются в случае, когда области
интереса взаимно не исключают друг друга. В такие
таблицы могут входить переменные с
многомерными откликами и многомерные дихотомии.
За дополнительной информацией обратитесь к
разделу Таблицы
многомерных откликов в главе Основные статистики.
Таблицы флагов
и заголовков (таблицы заголовков). Таблицы
флагов и заголовков - это фактически
двухвходовые таблицы, единственное отличие
которых заключается в том, что вместо двух
переменных кросстабулируются два списка
группирующих переменных. В таблице флагов и
заголовков один список табулируется по
столбцам таблицы результатов (горизонтально), а
второй - по строкам таблицы результатов
(вертикально).
За дополнительной информацией обратитесь к
разделу Таблицы
флагов и заголовков в главе Основные
статистики.
Таблицы частот
(одновходовые таблицы).) Таблицы частот
или одновходовые таблицы представляют собой
простейший метод анализа категориальных (номинальных) переменных (см.
раздел Элементарные понятия
статистики). Часто их используют как одну из
процедур разведочного
анализа, чтобы просмотреть, каким образом
различные группы данных распределены в выборке.
Например, изучая зрительский интерес к разным
видам спорта (с целью рекламы какого-либо
продукта на ТВ), вы могли бы представить ответы
респондентов в следующей таблице:
STATISTICA ОСНОВНЫЕ СТАТИСТИКИ |
FOOTBALL: "Watching football" | |||
---|---|---|---|---|
Категория | Частоты | Кумул. частоты |
Процент | Кумул. процент |
ALWAYS : Always interested USUALLY : Usually interested SOMETIMS: Sometimes interested NEVER : Never interested Пропущено |
39 16 26 19 0 |
39 55 81 100 100 |
39.00000 16.00000 26.00000 19.00000 0.00000 |
39.0000 55.0000 81.0000 100.0000 100.0000 |
Эта таблица показывает число, долю, кумулятивную
или накопленную долю респондентов, выразивших
свой интерес к просмотру футбольных матчей в
следующей шкале: (1) Always interested - Всегда
интересуюсь, (2) Usually interested - Обычно интересуюсь, (3)
Sometimes interested - Иногда интересуюсь или (4) Never interested -
Никогда не интересуюсь.
За дополнительной информацией обратитесь к
разделу Таблицы
частот в главе Основные
статистики.
Тернарные графики.
Тернарный график используется для исследования
связей между несколькими переменными, когда три
из них представляют собой, например, компоненты
смеси (это означает, что сумма их остается
постоянной для всех наблюдений). Обычно такие
графики применяются при экспериментальном
исследовании зависимости отклика от
относительного содержания трех компонент
(например, трех химических соединений), при этом
соотношение компонент изменяется с целью
определения его оптимального значения (например,
при составлении смесей).
Тернарные
графики - 2М диаграмма рассеяния. На
тернарном графике этого типа для представления
трех (или более) переменных [компонент X, Y и
Z] на плоскости используется треугольная
система координат. Точки графика соответствуют
пропорциям переменных-компонент (X, Y и Z).
См. также Сокращение
объема выборки.
Тернарные
графики - 3М диаграмма рассеяния. На
тернарном графике этого типа для представления
четырех (или более) переменных [компонент X, Y,
Z и откликов V1, V2 и т.д.] в трехмерном
пространстве (на тернарных 3М диаграммах
рассеяния и графиках поверхностей) используется
треугольная система координат. Отклики (V1, V2
и т.д.), соответствующие пропорциям
переменных-компонент (X, Y и Z), равны
на тернарном графике высотам точек.
См. также Сокращение
объема выборки.
Тернарные
графики - Диаграмма отклонений. На
тернарном графике этого типа можно исследовать
связи между четырьмя и более переменными (X, Y,
Z и V1, V2 и т.д.), представленные в виде
"отклонений" от заданного уровня на оси V,
где три измерения (X, Y и Z)
представляют собой компоненты смеси (это
означает, что сумма их остается постоянной для
всех наблюдений).
Тернарные
графики - Зонная карта. Тернарный график
этого типа представляет собой проекцию
поверхности в виде зонной карты (подогнанной к
множеству данных с четырьмя координатами).
Тернарные
графики - Карта линий. Тернарный график
этого типа представляет собой проекцию
поверхности в виде карты линий (подогнанной к
множеству данных с четырьмя координатами).
Тернарные графики - Категоризованная карта зон. Тернарный график этого типа представляет собой проекцию 3М поверхности на 2М плоскость в виде зонной карты для каждого уровня группирующей переменной (или заданного пользователем подмножества данных). Для каждого уровня группирующей переменной строится один график, и все эти графики изображаются в одном графическом окне, давая возможность сравнивать подмножества данных (категории).
Подробную информацию о категоризованных графиках можно найти в разделе Категоризованные графики в главе Некоторые методы графического анализа данных.
Тернарные графики - Категоризованная карта линий. Тернарный график этого типа представляет собой проекцию 3М поверхности на 2М плоскость в виде карты линий для каждого уровня группирующей переменной (или заданного пользователем подмножества данных). Для каждого уровня группирующей переменной строится один график, и все эти графики изображаются в одном графическом окне, давая возможность сравнивать подмножества данных (категории).
Подробную информацию о категоризованных
графиках можно найти в разделе Категоризованные графики
в главе Некоторые
методы графического анализа данных.
Тернарные графики - Категоризованный график поверхности. На этом трехмерном тернарном графике, категоризованном по уровням группирующей переменной (или заданным пользователем подмножествам данных), к множеству данных с четырьмя координатами подгоняется поверхность. Для каждого уровня группирующей переменной строится один график, и все эти графики изображаются в одном графическом окне, давая возможность сравнивать подмножества данных (категории).
Тернарные
графики - Категоризованный пространственный
график. Тернарный график такого типа
является особым способом представления данных 3М
диаграммы рассеяния с помощью плоскости X-Y-Z
(заданной в треугольной системе координат),
расположенной на выбранном пользователем уровне
вертикальной оси V (которая проходит через
центр плоскости); эти данные категоризованы по
уровням группирующей
переменной (или заданным пользователем
подмножествам данных). Для каждого уровня группирующей переменной
строится один график, и все эти графики
изображаются в одном графическом окне, давая
возможность сравнивать подмножества данных
(категории).
Уровень плоскости X-Y-Z можно менять, чтобы
разделить пространство X-Y-Z-V на имеющие
особый смысл части (которые, например, будут
соответствовать разным структурам зависимости
между тремя переменными).
Тернарные
графики - Категоризованный трассировочный
график. На тернарном графике этого типа
можно исследовать зависимости между четырьмя и
более измерениями (X, Y, Z и V1, V2
и т.д.), представленными в виде 3М трассировочного
графика, категоризованного по уровням группирующей переменной
(или заданным пользователем подмножествам
данных). Для каждого уровня группирующей
переменной (или заданного пользователем
подмножества данных) строится один график, и все
эти графики изображаются в одном графическом
окне, давая возможность сравнивать подмножества
данных (категории).
Тернарные
графики - Пространственный график.
Тернарный график такого типа является особым
способом представления данных 3М диаграммы
рассеяния с помощью плоскости X-Y-Z (заданной
в треугольной системе координат), расположенной
на выбранном пользователем уровне вертикальной
оси V (которая проходит через центр
плоскости). Уровень плоскости можно менять, чтобы
разделить пространство X-Y-Z на имеющие
особый смысл части (которые, например, будут
соответствовать разным структурам зависимости
между тремя переменными).
Тернарные
графики - Трассировочный график. На
тернарном графике этого типа можно исследовать
связи между четырьмя и более переменными (X, Y, Z и
V1, V2 и т.д.), представленными в виде 3М
трассировочного графика, где три измерения (X, Y
и Z) представляют собой компоненты смеси (это
означает, что сумма их остается постоянной для
всех наблюдений). Точки данных на этом графике
расположены так же, как и на простой 3М диаграмме
рассеяния, но они соединены линией (в той
последовательности, в какой они расположены в
файле данных), представляющей собой "след"
последовательных значений.
Тип ветвления (для
Деревьев классификации). Тип ветвления
деревьев классификации
задает способ выбора варианта ветвления по
предикторным переменным, который применяется
для прогнозирования принадлежности исследуемых
объектов к классам значений зависимой
переменной. В соответствии с иерархической
структурой деревьев классификации, ветвления
осуществляются последовательно от корневой
вершины к дочерним вершинам, пока ветвление не
прекратится, и тогда неразветвленные дочерние
вершины становятся терминальными вершинами.
Процесс ветвления описан в главе о
деревьях классификации в разделе Вычислительные методы.
Толерантность (в
множественной регрессии). Толерантность
переменной определяется как 1 минус квадрат
коэффициента множественной корреляции этой
переменной со всеми остальными независимыми
переменными, входящими в уравнение
регрессии. Поэтому, чем меньше толерантность
переменной, тем более избыточен ее вклад в
уравнение регрессии (т.е. тем более ее вклад
избыточен при заданных значениях других
переменных). Если толерантность любой
переменной в уравнении регрессии равна нулю (или
очень близка к нулю), оценивание уравнения
регрессии невозможно (так как получаемая матрица
будет плохо обусловлена и не будет иметь
обратной).
Топологическая
карта. Радиальный слой сети Кохонена, элементы
которого располагаются на плоскости и обучаются
таким образом, чтобы близкие кластеры данных
соответствовали соседним элементам слоя.
Используется в кластерном
анализе (Kohonen, 1982; Fausett, 1994; Haykin, 1994; Patterson, 1996). См.
раздел Нейронные сети.
Трассировочный
график, 3М. На трассировочном графике
точки данных располагаются так же, как и на
обычных 3М диаграммах
рассеяния (значения переменных
соответствуют координатам X, Y и Z
каждой точки), но при этом соединяются линией (в
порядке их следования в файле данных),
визуализируя "след" последовательных
значений (например, движения, изменения
параметров с течением времени и т.п.).
Трассировочный график может служить наилучшим
средством отображения траектории объекта в
трехмерном пространстве.