Многомерное шкалирование.
Многомерное шкалирование (ММШ) — это класс методов для представления восприятий и предпочтений респондентов в пространстве с помощью наглядного изображения. Многомерное шкалирование - это не просто определенная процедура, а скорее способ наиболее эффективного размещения объектов, приближенно сохраняющий наблюдаемые между ними расстояния. Другими словами, ММШ размещает объекты в пространстве заданной размерности и проверяет, насколько точно полученная конфигурация сохраняет расстояния между объектами.
Воспринимаемые (психологические) взаимосвязи между объектами представляют в виде геометрических связей между точками в многомерном пространстве. Эти геометрические представления часто называют пространственными картами. Оси координат на пространственной карте соответствуют психологическим факторам поведения человека или, иначе говоря, основным размерностям, которыми пользуются респонденты для формирования восприятия и предпочтения объектов.
Многомерное шкалирование используют в маркетинге для различных целей.
• Измерение имиджа. Восприятие фирмы потребителями и непотребителями ее продукции в сравнении с собственным восприятием фирмы самой себя.
• Сегментация рынка. Расположение в одном и том же пространстве торговых марок и потребителей для выявления относительно однородных по восприятиям групп потребителей.
• Разработка нового товара. Многомерное шкалирование позволяет увидеть пробелы на пространственной карте, которые указывают потенциальные возможности для размещения новых товаров. Кроме того, этот анализ используют, чтобы с помощью тестирования оценить новый товар и существующие торговые марки и таким образом определить, как потребители воспринимают новые идеи, заложенные в товаре.
• Оценка эффективности рекламы. Пространственные карты можно использовать для определения эффективности рекламы с точки зрения занятия торговой маркой желаемого положения на рынке.
• Ценовой анализ. Сравнение пространственных карт, разработанных с учетом и без учета восприятия цены, позволяет определить влияние цены на поведение покупателей.
• Решение о числе каналов сбыта. Мнения респондентов о сопоставимости торговых марок с различными торговыми точками могут привести к пространственным картам, полезным для принятия решения о количестве каналов сбыта.
• Построение шкалы отношений. Методы многомерного шкалирования используются для разработки соответствующей по размерности и конфигурации шкалы отношений.
Основное предположение многомерного шкалирования заключается в том, что существует некоторое метрическое пространство существенных базовых характеристик, которые неявно и послужили основой для полученных эмпирических данных о близости между парами объектов. Следовательно, объекты можно представить как точки в этом пространстве. Предполагают также, что более близким (по исходной матрице) объектам соответствуют меньшие расстояния в пространстве базовых характеристик. Таким образом, многомерное шкалирование - это совокупность методов анализа эмпирических данных о близости объектов, с помощью которых определяется размерность пространства существенных для данной содержательной задачи характеристик измеряемых объектов и конструируется конфигурация точек (объектов) в этом пространстве. Это пространство (многомерная шкала) аналогично обычно используемым шкалам в том смысле, что значениям существенных характеристик измеряемых объектов соответствуют определенные позиции на осях пространства.
Таким образом, при осуществлении многомерного шкалирования каждый объект представляется точкой xi на плоскости или в пространстве. В простейшем случае многомерного шкалирования каждое значение близости distjk есть расстояние между точками xj и хk , distjk = dist (xj, хk) + ошибка. Таким образом, многомерное шкалирование представляет собой процедуру описания матрицы близости в терминах расстояний между точками. В общем случае не требуется, чтобы точки располагались на плоскости или в трехмерном пространстве. Можно использовать любое евклидово пространство малой размерности.
Главным в многомерном шкалировании является то, что на вход подается матрица близости, а на выходе получается размещение точек. Таким образом обеспечивается пространственное представление величин близости. Как и в любом другом статистическом методе, обеспечивающем представление или описание данных, это представление может быть более или менее точным. Конечно же, точность представления важна. Когда она слишком плохая, ценность представления мала.
К статистикам, используемым в многомерном шкалировании, относятся:
Оценка сходства. Рейтинги всех возможных пар торговых марок или других объектов, отражающие их сходство по шкале Лайкерта.
Ранги предпочтений. Ранги торговых марок или других объектов в порядке их уменьшения (от большего к меньшему). Обычно эти данные получают при опросе респондентов.
Стресс. Мера соответствия подогнанной модели исходным данным: чем выше значение стресса, тем ниже качество подгонки модели.
R-квадрат. Это квадрат коэффициента корреляции, который показывает долю дисперсии оптимально отображенных данных, которые могут быть учтены ММШ. Мера соответствия подогнанной модели исходным данным.
Пространственная карта. Воспринимаемые взаимосвязи между торговыми марками или другими объектами, представленные в виде геометрических связей между точками в многомерном пространстве.
Рисунок 5.11. Процедура многомерного шкалирования.
Процедура многомерного шкалирования представлена на рисунке. 5.11.
1. Формулировка проблемы.
При формулировании проблемы исследователю необходимо конкретизировать цель использования результатов многомерного шкалирования и выбрать торговые марки или другие объекты, которые предполагается проанализировать. Именно они определяют размерность шкалирования и получаемые конфигурации. В основе выбора количества торговых марок и их конкретных наименований должна лежать проблема, маркетингового исследования, теоретические предпосылки и интуиция исследователя.
Чтобы получить хорошо определяемую пространственную карту, следует включить как минимум семь-восемь торговых марок или объектов. Включение свыше 25 торговых марок будет громоздким и утомит респондендов при опросе.
2. Получение исходных данных.
Для осуществления многомерного шкалирования необходимо получить от респондентов данные, связанные с восприятием и предпочтениями.
Существуют прямые и непрямые подходы к сбору данных о восприятии объектов.
Восприятие объектов: прямые подходы. При использовании прямого подхода к сбору данных о восприятии респондентов просят оценить, используя их собственный критерий, насколько похожи или не похожи между собой различные известные торговые марки. От респондентов часто требуется оценить все возможные пары известных торговых марок, рассматривая их сходство по шкале Лайкерта. Эти данные связаны с оценками респондентов о сходстве товаров. Число оцениваемых пар равно n?(n — 1)/2, где n — число объектов.
Существуют и другие методы сбора данных. Респондентов можно попросить проранжировать все возможные пары от наиболее похожих к наименее похожим.
Прямые методы имеют то преимущество, что исследователю не приходится определять набор явных характеристик. Респонденты оценивают сходство объектов, используя собственный критерий. К недостаткам прямого подхода можно отнести то, что на критерий влияют рассматриваемые торговые марки. Если различные известные марки автомобилей находятся в одном ценовом диапазоне, то цена не будет важным фактором. Достаточно сложно определить перед началом анализа, надо ли и если надо, то как объединять оценки респондентов. Более того, может быть затруднительно дать название размерностям на пространственной карте.
Восприятие объектов: непрямые (атрибутивные) подходы. Непрямые подходы к сбору данных о восприятии основаны на характеристиках объектов и требуют, чтобы респонденты оценивали объекты, исходя из их определенных характеристик, используя семантическую дифференциальную шкалу или шкалу Лайкерта.
Иногда в набор объектов также включают идеальную торговую марку. Респондентов просят оценить гипотетическую идеальную торговую марку по одному и тому же набору характеристик. Если атрибутивные рейтинги получены, то для каждой пары торговых марок выводят меру сходства (евклидово расстояние).
Преимущество непрямого подхода состоит в том, что легко разделить респондентов на однородные группы в соответствии с их отношением к объекту, т.е. исходя из оценок свойств объекта. Также легко обозначить размерности на пространственной карте. Недостатком метода считается то, что исследователь должен определить все явные характеристики, а это непростая задача. На основе идентифицированных характеристик получают пространственную карту.
Прямые подходы используют чаще, чем непрямые. Однако лучше всего использовать оба подхода как взаимодополняющие. Суждения респондентов о сходстве объектов, полученные прямым методом, используются для получения пространственной карты, а атрибутивные оценки — для интерпретации размерностей карты восприятий. Аналогичные процедуры используют для данных, касающихся предпочтений респондентов.
Предпочтения респондентов. С помощью данных о предпочтениях маркетолог может увидеть порядок предпочтения объектов респондентами с точки зрения какого-либо их свойства. Обычный способ получения таких данных — ранжирование предпочтений. От респондентов требуется проранжировать торговые марки в порядке снижения их предпочтения (от наиболее предпочитаемого к наименее). Альтернативно, респондентов можно попросить выполнить попарное сравнение и указать, какую торговую марку они предпочитают в данной паре. Другой метод сбора данных о предпочтениях — получение оценок предпочтений для разных торговых марок.
Если в основе пространственной карты лежат данные о предпочтениях, то расстояние означает различие в предпочтениях. Конфигурация, выведенная из данных о предпочтениях, может сильно отличаться от конфигурации, полученной на основе данных сходства объектов. Две торговые марки можно воспринимать как различные на карте восприятий, и как одинаковые на карте предпочтений, и наоборот.
3. Выбор метода многомерного шкалирования.
Существует несколько разновидностей процедур многомерного шкалирования.
Во-первых, различают метрические и неметрические методы многомерного шкалирования.
Выбор конкретного метода многомерного шкалирования зависит от того, какие именно данные — о восприятиях или о предпочтениях, подлежат шкалированию, или необходимо проанализировать оба их вида. Природа исходных данных определяющий фактор.
Метрические методы многомерного шкалирования предполагают, что исходные данные интервальные или относительные.
Неметрические методы многомерного шкалирования предполагают, что исходные данные будут порядковыми, но в результате анализа они преобразуются в интервальные или относительные.
Предположим, что расстояния на полученной пространственной карте выражены в интервальной шкале. Неметрические методы многомерного шкалирования определяют, в заданной размерности, пространственную карту, на которой ранговые порядки оцененных расстояний между торговыми марками или объектами наилучшим образом сохраняют или воспроизводят ранговые порядки исходных данных.
Поскольку при использовании метрических методов многомерного шкалирования выходные данные также интервальные или относительные, между исходными и выходными данными существует сильная взаимосвязь, а атрибуты исходных данных также сохраняются. Метрические и неметрические методы приводят к одинаковым результатам.
Метрические методы могут быть основаны на использовании линейного и нелинейного подхода.
Линейный подход основан на ортогональном проектировании в подпространство, образованное направлениями, характеризующимися значительным разбросом точек. Такое решение дает max?dist2jk при ортогональном проектировании.
В нелинейном случае пытаются найти отображение D > dist, которое бы минимально искажало исходные различия Djk. Вводится критерий качества отображения, называемый «стрессом» и измеряющий степень расхождения между исходными различиями Djk и результирующими расстояниями djk. С помощью аппарата нелинейной оптимизации ищется конфигурация точек, которая давала бы минимальное значение «стрессу». Значения координат этих точек и являются решением задачи. В качестве «стресса» используются разные виды функционалов, в простейшем случае
Нелинейный подход, как правило, приводит к пространству меньшей размерности, чем линейный. В линейном случае допускаются искажения лишь в сторону уменьшения различий. В нелинейном — возможны искажения как в ту, так и в другую сторону. Предпосылки получения отображения в пространстве невысокой размерности можно создать, если допустить возможность некоторого увеличения больших расстояний и уменьшения маленьких.
Неметрический (или монотонный) подход в своей последней модификации основан на следующем соображении. Поскольку исходная матрица различий не является точной матрицей расстояний в каком-либо метрическом пространстве, то не следует стремиться аппроксимировать непосредственно эти различия. Нужно подобрать такую последовательность чисел, которая была бы монотонна с исходными различиями, но была бы более близка к точным расстояниям. Эту последовательность чисел уже можно использовать в качестве эталонной. Однако не известен способ построения такой последовательности с учетом лишь первоначальных различий. Предлагается многоэтапная процедура, использующая начальную конфигурацию точек. На первом этапе подбирается числовая последовательность { }, монотонная с исходными различиями и минимально отклоняющаяся от расстояний начальной конфигурации. Затем ищется новая конфигурация, расстояния которой в наилучшей мере аппроксимируют числовую последовательность { }. На втором этапе опять подбирают новую последовательность { } и конфигурацию изменяют так, чтобы ее расстояния приближали эту последовательность, и т. д. Таким образом, в качестве критерия, измеряющего качество отображения, используется функционал вида
Нормирующий множитель 1/?dist2jk вводится для того, чтобы на качество решения не влиял масштаб конфигурации.
Нелинейный и неметрический подходы имеют преимущество перед линейным. Не ограничиваясь ортогональным проектированием, они позволяют получить хорошее отображение в пространстве меньшего числа измерений. Если размерность пространства оценена правильно, то после вращения координатные оси могут быть интерпретированы как факторы, лежащие в основе субъективных различий между стимулами. Если же размерность недооценена, то решение допускает интерпретацию только в терминах кластеров.
Нелинейные и неметрические методы опираются, как правило, на дистанционную модель: различия между стимулами приближаются расстояниями между соответствующими им точками. Для поиска решения они используют градиентные процедуры минимизации функционала. В большинстве случаев расстояния между точками вычисляются по евклидовой метрике, которая не чувствительна к вращению осей и переносу начала координат. Качество решения не зависит от направления системы координат, по этой причине формально полученные оси не могут нести смысловую нагрузку — для содержательной интерпретации они должны быть ориентированы соответствующим образом.
Во-вторых, маркетолог должен решить будут ли оценки отдельных респондентов объединяться с целью получения групповых (агрегированных) карт восприятия, или же будут разрабатываться индивидуальные карты.
Проблема использования индивидуальных карт заключается в их большом количестве даже в случае использования выборки умеренного объема (например, 100 карт многомерного шкалирования, по одной от каждого члена выборки), что существенно затрудняет их использование при разработке маркетинговой стратегии.
Менеджеры обычно рассматривают вопросы маркетингового планирования с учетом поведения рыночных сегментов, а не отдельных покупателей. В этом случае целесообразно использование групповых карт восприятия. Однако при объединении индивидуальны данных необходимо сделать некоторые допущения. Возможно ли, чтобы респонденты использовали одинаковое число критериев для оценки разных марок? А если это число окажется одинаковым, то будут ли одинаковыми сами критерии? Если ответ на последний вопрос будет отрицательным, то какие критерии следует использовать для объединения респондентов в группы? Один из популярных алгоритмов, INDSCAL (шкалирование индивидуальных различий) предполагает, что для оценки подобия объектов все респонденты использует одни и те же критерии, но затем они придают разное весовое значение каждому из параметров при формировании своих суждений.
В-третьих, если собраны данные о предпочтениях респондентов, то можно выполнить развертывание, т.е. разместить «идеальные» для каждого из них точки в пространстве, в котором расположены торговые марки или объекты. Это можно осуществить с помощью двух способов.
Если собраны только данные о предпочтениях, можно выполнить их внутренний анализ предпочтений – внутреннее развертывание. При этом не только идеальные для респондентов точки, но и точки торговых марок или объектов размещаются по данным о предпочтениях.
Если кроме этого имеются данные о близости торговых марок или объектов, то можно выполнить внешний анализ предпочтений – внешнее развертывание. В этом случае сначала по данным о сходстве размещаются соответствующие им точки, а затем к готовой информации по данным о предпочтениях добавляется идеальная точка каждого респондента. Этот вариант получил более широкое применение. Если известны только предпочтения респондентов, точки двух марок, которые по мнению респондентов очень похожи между собой, будут расположены на карте достаточно далеко друг от друга, если респонденты устойчиво предпочитают одну из марок другой. При этом у исследователя мало шансов понять смысл оси, по которой эти марки столь далеко разнесены.
4. Принятие решения о количестве размерностей.
Цель многомерного шкалирования – получить пространственную карту с наименьшим количеством размерностей, которая наилучшим образом подходит для анализа данных. Однако пространственные карты рассчитывают таким образом, что соответствие модели исходным данным увеличивается с ростом количества размерностей пространства. Вообще говоря, чем больше размерность пространства, используемого для воспроизведения расстояний, тем лучше согласие воспроизведенной матрицы с исходной (меньше значение стресса). Если взять размерность пространства равной числу переменных, то возможно абсолютно точное воспроизведение исходной матрицы расстояний. Однако в связи с тем, что визуальную интерпретацию можно проводить только в двумерном пространстве или с тремя осями, всегда предпочтительнее иметь меньшее число последних. Поэтому следует идти на компромисс.
Для определения того насколько принятое в рамках многомерного шкалирования решение соответствует точному отображению исходных данных, используют показатель стресса: чем выше значение стресса, тем ниже качество подгонки модели. Обычно величина стресса возрастает по мере уменьшения числа осей.
Существует несколько подходов к определению количества размерностей.
Определение, основанное на предварительной информации. Иногда, руководствуясь результатами прошлых исследований, исследователь знает, сколько размерностей следует выделить в конкретной ситуации.
Определение на основе критерия изогнутости. Необходимое для расположения объектов в пространстве число осей можно получить, построив график зависимости стресса от числа осей. Как и в случае с факторным анализом (график «каменистой осыпи»), а также кластерным анализом (график сумм квадратов ошибок), выбор соответствующего числа осей зависит от того, в какой точке начинается скачкообразное изменение стресса. На рисунке 5.12 построен график зависимости стресса от числа осей. Можно видеть, что большему числу осей соответствуют меньшие значения стресса — и наоборот. График показывает, что, вероятно, двумерное решение является приемлемым, поскольку при переходе от двух осей к одной происходит резкое увеличение стресса.
Рисунок 5.12. График зависимости стресса от числа осей.
Определение, основанное на легкости использования. Иногда намеренно стремятся получить двумерное представление — менеджеры всегда предпочитают его, поскольку его проще интерпретировать.
5. Обозначение размерностей и интерпретация конфигурации точек на пространственной карте.
Как только пространственная карта создана, необходимо дать название соответствующим размерностям (осям координат на пространственной карте) и интерпретировать конфигурацию точек на карте. Исследователь самостоятельно принимает решение об обозначении размерности, руководствуясь своим опытом. В этом помогут следующие правила.
А) Даже если прямым методом получены суждения респондентов о сходстве объектов, то все равно можно собрать рейтинги торговых марок по характеристикам объекта. С помощью регрессионного анализа эти атрибутивные векторы можно расположить на пространственной карте. Затем осям координат дается обозначение, исходя из того, насколько близко векторы совмещаются с соответствующими осями.
Б) После сбора прямым методом респондентами оценок сходства или восприятия их можно попросить указать критерий, используемый в их оценках. Затем эти критерии привязываются к осям пространственной карты.
В) По возможности респондентам следует показывать пространственные карты, получившиеся на основе их оценок и попросить обозначить оси, анализируя получившуюся конфигурацию точек.
Г) Если существуют объективные характеристики товаров (например, килограммы), то их можно использовать как средство интерпретации субъективных размерностей пространственной карты.
Часто ось представляет несколько характеристик объекта. Пространственную карту можно интерпретировать, изучив координаты и относительное расположение торговых марок. Например, торговые марки расположенные рядом, конкурируют более жестко. Изолированно расположенные торговые марки имеют свой уникальный имидж. Торговые марки, удаленные от начала осей координат, сильнее по данной характеристике. Таким образом, можно истолковать силу и слабость каждого товара. Пробелы на пространственной карте могут указывать на потенциальные возможности для внедрения на рынок новых товаров.
6. Оценка надежности и достоверности.
Для того, чтобы оценить надежность и достоверность полученных в ходе многомерного шкалирования результатов, целесообразно осуществить следующие действия.
• Рассчитать коэффициент соответствия или R2 — квадрат коэффициента корреляции, указывающий на долю дисперсии оптимально шкалированных данных, которая может быть учтена методом многомерного шкалирования. Таким образом, этот коэффициент показывает, насколько хорошо модель многомерного шкалирования соответствует исходным данным. Несмотря на то, что желательно иметь высокие значения R2, допустимыми считаются значения 0,60 и выше.
Рассчитать значение стресса. R2 представляет собой меру соответствия модели исходным данным, а стресс — меру несоответствия модели или долю дисперсии оптимально шкалированных данных, которую не учитывает модель многомерного шкалирования. Значения стресса варьируют в зависимости от метода многомерного шкалирования и анализируемых данных.
• Для значений стресса, вычисляемых по стресс-формуле Краскела, даются следующие рекомендации.
Стресс (%) Критерий соответствия модели
20 Плохое
10 Удовлетворительное
5 Хорошее
2,5 Отличное
0 Превосходное(полное)
• Если анализ проводят на агрегатном уровне, то исходные данные можно разбить на две или больше частей. Процедуру многомерного шкалирования следует выполнить отдельно для каждой части, а затем результаты сравнить.
• Некоторые из объектов можно выборочно исключить из исходных данных и решения принимать по оставшимся объектам.
• К исходным данным можно добавить случайный ошибочный член. Полученные в результате данные подвергают многомерному шкалированию и решения сравнивают.
• Исходные данные можно собрать в разное время и сравнить проверочные тесты между собой.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Из каких этапов состоит процесс подготовки данных к анализу?
2. Охарактеризуйте задачи, решаемые в ходе простого табулирования.
3. Перечислите известные Вам приемы статистической корректировки данных.
4. Какие методы анализа относятся к базовым? Какова их цель?
5. Какие показатели относятся к показателям центра распределения? Для каких типов данных они рассчитываются и что показывают?
6. Что такое статистическая гипотеза? Какая гипотеза проверяется по результатам кросс-табуляции?
7. Перечислите основные статистики, используемые в дисперсионном анализе. Из каких этапов состоит процедура дисперсионного анализа?
8. Каким образом производится проверка практической значимости исходных данных ковариационного анализа?
9. Охарактеризуйте процесс интерпретации результатов многофакторного дисперсионного анализа.
10. Для каких целей целесообразно осуществление корреляционного и регрессионного анализа?
11. Что такое поле корреляции? Какую информацию дает исследователю его построение?
12. Назовите цель проведения и возможности использования результатов дискриминантного анализа.
13. Какие требования предъявляются к переменным, участвующим в дискриминантном анализе, относительно типов шкал измерения переменных?
14. Из каких этапов состоит процедура факторного анализа? Назовите основные методы факторного анализа и укажите, в чем состоит различие между ними.
15. Перечислите основные понятия, используемые в кластерном анализе. Из каких этапов состоит процедура кластерного анализа?
16. Для каких целей целесообразно применение многомерного шкалирования? Из каких этапов состоит процедура многомерного шкалирования?
17. Назовите основные методы многомерного шкалирования и укажите, в чем состоит различие между ними?
Похожие рефераты: