Построение таблиц сопряженности признаков
Маркетологов интересуют вопросы связи одной переменной с другими. На такие вопросы можно ответить с помощью таблицы сопряженности признаков. В то время как вариационный ряд характеризует одну переменную, построение таблиц сопряженности признаков (кросс-табуляция) помогает увидеть одновременно значения двух и больше переменных.
Построение таблиц сопряженности признаков или кросс-табуляция – это статистический метод, который одновременно характеризует две и больше переменных; это процесс объединения распределений частот значений двух и больше переменных в одну таблицу, которая объясняет, как одна переменная связана с другой.
Преимущества кросс-табуляции: менеджеры легко понимают и интерпретируют результаты; становятся очевидными возможные управленческие действия; лучшее понимание сложного явления, чем многовариантный анализ; облегчает проблему разбросанных ячеек, которая затрудняет дискретный многовариантный анализ; простота выполнения и поэтому доступен исследователям, менее искушенным в вопросах статистики.
Две переменные. Кросс-табуляцию с двумя переменными можно рассматривать как двумерную. Проценты помогают лучше понять полученные результаты.
Три переменные. Введение третьей переменной позволяет четче уяснить природу исходной связи между переменными. Третья переменная может привести к четырем возможностям:
1) уточнить связь, наблюдаемую между исходными переменными;
2) указать на отсутствие связи между переменными, хотя первоначально связь наблюдалась. Другими словами, третья переменная покажет, что исходная связь между двумя переменными была ложной;
3) показать некоторую связь между двумя переменными, хотя первоначально она не наблюдалась. В этом случае третья переменная показывает скрытую связь между первыми двумя переменными;
4) показать отсутствие изменений в первоначальной связи.
Можно построить таблицу сопряженности больше, чем для трех переменных, но полученные результаты будет сложно интерпретировать. Кроме того, в каждой ячейке может остаться малое количество респондентов. Как правило, чтобы вычислить статистику в каждой ячейке должно быть, по крайней мере, пять наблюдений. Таким образом, кросс-табуляция – неэффективный способ проверки связей для ситуации с несколькими переменными, она рассматривает просто связь между переменными, а не причинность. Чтобы изучить причинно-следственную связь, необходимо провести причинно-следственное исследование.
Статистики таблиц сопряженности
Проверка гипотез о связи между переменными
Рассмотрим статистики, которые обычно используются для оценки статистической значимости и тесноты связи переменных в таблице сопряженности.
Статистическая значимость наблюдаемой связи обычно измеряется критерием хи-квадрат. Связь можно измерить коэффициентом корреляции фи, коэффициентом сопряженности признаков, V-коэффициентом Крамера и коэффициентом «лямбда».
Проверка гипотез о различиях
Этапы процедуры проверки гипотез о различиях:47
1. Параметрические методы проверки (метрические данные):
1.1. Одна выборка: t-критерий, z-критерий.
1.2. Две выборки:
1.2.1. Независимые выборки: двухгрупповой t-критерий, z-критерий.
1.2.2. Парные выборки: парный t-критерий.
2. Непараметрические методы проверки (неметрические данные):
2.1. Одна выборка: критерий хи-квадрат, критерий Колмогорова-Симрнова, критерий серий, биноминальный критерий.
2.2. Две выборки:
2.2.1. Независимые выборки: критерии хи-квадрат, Манна-Уитни, медианы, Колмогороа-Смирнова.
2.2.2. Парные выборки: критерий знаков, Вилкоксона, МакНемара, хи-квадрат.
Параметрические методы проверки гипотез предполагают, что изучаемые переменные измерены с помощью интервальной шкалы. Непараметрические методы проверки гипотез предполагают, что переменные измерены с помощью номинальной или порядковой шкал.
Выборки независимы в том случае, если они случайно взяты из различных генеральных совокупностей. Данные, принадлежащие различным группам респондентов (например, мужчины и женщины), обычно обрабатываются как независимые выборки. Выборки являются попарными (связанными), когда данные двух выборок имеют отношение к одной и той же группе респондентов.
Наиболее популярный параметрический критерий для проверки гипотез о равенстве средних – расчет значений t-статистики.
Похожие рефераты: