Статистическая корректировка данных
Статистическая корректировка данных включает взвешивание, переопределение переменной и преобразования шкалы измерений. Все эти корректировки необязательны, но могут значительно повысить качество анализа.
Взвешивание. При взвешивании каждому наблюдению или респонденту присваивается весовой коэффициент, отображающий степень его значимости по сравнению с другими наблюдениями или респондентами. Цель взвешивания – увеличить или уменьшить в выборке количество наблюдений с определенными характеристиками. Часто применяется для того, чтобы привести выборочные данные в точное соответствие конкретными характеристиками генеральной совокупности. Можно повысить значимость наблюдений или респондентов, по которым собраны данные более высокого качества, или повысить значимость ответов с определенными признаками. Например, присвоить большой весовой коэффициент респондентам, которые пользуются данным товаром чаще других. Метод взвешивания следует применять с большой осторожностью, поскольку он нарушает саму природу самовзвешиваемости выборочного обследования. Необходимо тщательно документировать всю процедуру взвешивания и отразить это в отчете.
Переопределение переменной заключается в преобразовании данных для создания новых переменных или изменения существующих. Цель переопределения – создание переменных, максимально отвечающих основным задачам исследования. Так, если изначальной переменной был показатель использования продукции с десятью категориями ответов, то число категорий можно сократить до четырех: часто, средне, редко и никогда. Одна из самых важных процедур преобразования – это использование фиктивных (двоичных) переменных для переопределения категорий. Это переменные, которые могут принимать только два значения, обычно 0 или 1.
Преобразование шкалы измерения – это манипулирование значениями шкалы с тем, чтобы иметь возможность сравнивать ее с другими шкалами либо преобразовывать данные и делать их долее подходящими для анализа. Так, для оценки имиджа товара обычно используется семибалльная семантическая дифференциальная шкала; для оценки отношения – интервальная рейтинговая шкала; для оценки образа жизни – пятибалльная шкала Лайкерта. Бессмысленно сравнивать позиции респондентов, полученные с использованием разных шкал, – эти шкалы необходимо преобразовать.
14.7. Выбор стратегии анализа данных
Процесс выбора стратегии анализа данных включает:
1. Предыдущие этапы процесса маркетинговых исследований (1 – определение проблемы, 2 – разработка подхода, 3 – разработка плана исследования).
2. Известные характеристики данных.
3. Конкретные свойства статистических методов.
4. Опыт и методологию исследователя.
5. Стратегию анализа данных.
Анализ данных – это не конечный этап исследования. Его цель – получить информацию, которая поможет решить определенную проблему. В качества трамплина используется предварительный план анализа данных, разработанный как элемент плана исследования.
Анализ известных характеристик данных приводит к выбору шкал измерения и статистического метода анализа. Выбор стратегии анализа данных сильно зависит от результатов изучения собранных данных на этапе их подготовки к анализу.
Чрезвычайно важно учитывать конкретные характеристики разных статистических методов, их цели и лежащие в их основе предположения. Некоторые методы больше подходят для исследования различий между переменными; другие – для оценки величин соотношений между переменными; третьи – для составления прогнозов. Некоторые методы лучше других выдерживают нарушения предположений, лежащих в их основе. Как правило, для анализа данных одного проекта можно использовать сразу несколько методов.
14.8. Классификация статистических методов
Статистические методы делятся на одно- и многомерные.
Одномерные методы используются, когда все элементы выборки оцениваются единым измерителем, либо если этих измерителей несколько для каждого элемента, но каждая переменная анализируется при этом отдельно от всех остальных.
Одномерные методы можно классифицировать на основе того, какие данные анализируются: метрические или неметрические. Метрические данные измеряются по интервальной или относительной шкале; неметрические оцениваются по номинальной или порядковой шкале.
Затем одномерные методы делят на классы на основе количества выборок – одна, две или более – анализируется в исследовании. Число выборок определяется задачами анализа, а не способом сбора информации. Выборки считаются независимыми, если они произвольно выделены из разных генеральных совокупностей. Для анализа данные, относящиеся к разным группам респондентов (например, мужчины и женщины), обычно обрабатываются как независимые выборки. Если данные по двум выборкам относятся к одной и той же группе респондентов, выборки считаются объединенными в пары.
Классификация одномерных статистических методов:44
1. Метрические данные.
1.1. Одна выборка: t – критерий, Z – критерий.
1.2. Две и больше выборок.
1.2.1. Независимые методы: двухгрупповой t – критерий, Z – критерий, однофакторный дисперсионный анализ.
1.2.2. Взаимосвязанные методы: парный t – критерий.
2. Неметрические методы.
2.1. Одна выборка: вариационный ряд, критерий хи-квадрат, критерий Колмогорова-Смирнова, критерий серий, биноминальный критерий.
2.2. Две или больше выборки.
2.2.1. Независимые: критерий хи-квадрат, критерий Манна-Уитни, медианы, критерий Колмогорова-Смирнова, критерий Крускала-Уоллиса и ANOVA.
2.2.2. Взаимосвязанные: критерий знаков, критерий Вилкоксона, критерий Макемара, критерий хи-квадрат.
Многомерные методы хорошо подходят для анализа данных, если для оценки каждого элемента выборки используются два или больше измерителей, а эти переменные анализируются одновременно. Такие методы используются для определения одновременных взаимосвязей между двумя и больше явлениями.
Многомерные методы отличаются от одномерных, прежде всего тем, что при их использовании центр внимания смещается с уровней (средних показателей) и распределений (дисперсий) явлений и сосредотачивается на степени взаимосвязи (корреляции и ковариации) между явлениями.
Классификация многомерных статистических методов:
1. Методы для зависимых переменных.
1.1. Одна зависимая переменная: кросс-табуляция, дисперсионный и ковариационный анализ, множественная регрессия, двухгрупповой дискриминантный анализ, совместный анализ.
1.2. Несколько зависимых переменных: многомерный дисперсионный и ковариационный анализ, анализ канонической корреляции, множественный дискриминантный анализ.
2. Методы для взаимозависимых переменных.
2.1. Взаимозависимые переменные: факторный анализ.
2.2. Межобъектное сходство: кластерный анализ, многомерное щкалирование.
Методы зависимости применяются, когда одна или больше переменных идентифицированы как зависимые, а остальные – как независимые. Если только одна зависимая переменная, то используются такие методы анализа, как кросс-табуляция, дисперсионный и ковариационный анализ, регрессионный анализ, двухгрупповой дискриминантный анализ и совместный анализ. Если имеется больше одной зависимой переменной, следует использовать многомерные методы анализа: дисперсионный и ковариационный, канонической корреляции и множественный дискриминантный анализ.
При применении методов взаимозависимости переменные не подразделяются на зависимые и независимые; напротив, исследуется набор взаимоза-висимых взаимосвязей. Цель – сгруппировать данные по лежащему в их основе сходству, что позволяет интерпретировать разные структуры данных. Так выявляется взаимозависимость переменных или межобъектные сходства. При исследовании взаимозависимости переменных чаще всего применяется факторный анализ. Анализ межобъектного сходства можно вести, используя методы кластерного анализа и многомерного шкалирования.
Похожие рефераты: