Применение многомерного шкалирования в социологических исследованиях


Применение многомерного шкалирования в социологических исследованиях: краткий обзор

К числу методов анализа, незаслуженно мало используемых российскими социологами, относится многомерное шкалирование. Попробуем восполнить пробел, используя в качестве иллюстрации результаты вторичного анализа экспертного рейтинга влиятельности, публикуемого в Независимой газете с 1993 года [1]. В этом исследовании каждый месяц эксперты (примерно 50 журналистов и политологов) оценивают по шкале от 0 до 10 влиятельность российских политиков.

Хорошо известно, что большинство используемых социологических характеристик не являются одномерными: даже при решении простейшей задачи социолог сталкивается с наличием множества критериев оценки некоего объекта (например, влиятельности политика). Традиционные методы одномерного шкалирования позволяют работать только с одним признаком, ограничивая поле исследования. Методы многомерного анализа дают возможность учитывать многообразие объекта изучения и получать более полную картину. К числу методов многомерного анализа, помимо многомерного шкалирования, относятся факторный и кластерный анализ, техники развертывания.

В каких случаях стоит использовать многомерное шкалирование (МШ)? Прежде всего, у исследователя должны быть основания считать, что исследуемая характеристика многомерна, включает в себя несколько параметров. Скажем, при оценке влиятельности политика мы учитываем масштаб его влияния (оказывает влияние только в своем регионе или же и на всю страну), источники влиятельности (личные качества или занимаемая должность), способы влияния (экономическое или политическое влияние), характер влияния (публичное или закулисное), силу, продолжительность и знак влияния (положительное или отрицательное). Как уже отмечалось, найти многомерные социальные характеристики нетрудно. Гораздо важнее, чтобы число латентных признаков (факторов) было небольшим, поскольку целью МШ является выделение этих факторов и представление их в графической форме. Как правило, это требование выполнимо; в противном случае исследователю нужно задуматься о том, правильно ли была определена характеристика (скорее всего, она излишне широкая или смешивается с другими переменными). Наконец, существует еще одно важное условие. Необходимо, чтобы ваши респонденты, вынося свои суждения, руководствовались этим небольшим набором признаков - в противном случае исследование теряет смысл.

Следует отметить, что данные предположения являются базовыми для всех методов многомерного анализа. Итак, имеется некоторая характеристика и есть все основания полагать, что респонденты используют некоторый ограниченный набор признаков для ее оценки, а различия между объектами объясняются расхождениями по ним. Чем сильнее отличаются оценки двух объектов, тем больше должны быть различия между ними по набору латентных признаков. Следовательно, оцениваемые объекты можно так расположить в пространстве факторов (латентных признаков), чтобы имелась зависимость между оценками объектов и расстояниями между объектами в пространстве восприятия. Чем больше сходство между объектами, тем меньше между ними расстояние в конструируемом пространстве факторов. Это и есть принцип построения модели МШ. Таким образом, в основе МШ лежат два фундаментальных предположения: предположение об объединенном психологическом пространстве (в одном пространстве латентных факторов описываются точками и объекты, и респонденты) и предположение о зависимости между оценками объектов и расстоянием между ними в искомом пространстве факторов.

В самом общем виде МШ представляет собой «набор статистических методов оценки параметров различных пространственных дистанционных моделей для данных о близости и методов оценки соответствия этих моделей данным» [2:10]. Расшифруем это определение.

Первоначально у нас имеются оценки некоторых объектов (стимулов). В нашем случае – это оценки влиятельности некоторого числа политиков: политик А – 8 баллов, Б – 10, В – 3 и так для всего количества Nобъектов. Но нас интересуют не сами оценки, а величина различий между оценками влиятельности: между А и Б (2 балла), А и В (5 баллов) и т.д. В результате мы имеем симметричную матрицу размерностиNхN(по количеству оцениваемых объектов; в нашем случае - политиков). Как правило, это матрица различий, поскольку выясняется величина различий между объектами; реже строится матрица близости. Эта матрица может рассматриваться как «данные о близости» между стимулами.

В наиболее общем виде процесс МШ можно представить как перевод исходных данных в некоторую монотонную функцию с последующим определением координат стимулов - объектов в пространстве факторов. Эти координаты называют «оценками координат стимулов», а сам процесс поиска – оценкой параметра (в статистике любую искомую величину принято называть «оценкой», там самым подчеркивая отличие найденного значения от истинного значения неизвестного «параметра»). Разумеется, для поиска координат («оценки параметров») используется «набор статистических методов». Наши стимулы размещаются в пространстве, осями которого являются искомые латентные признаки. Принципы построения этой пространственной модели могут быть различными: мы привыкли иметь дело с Евклидовой моделью пространства, но есть и другие модели (например, метрика города, метрика доминирования, которые, включая Евклидову, являются частными случаями метрики Минковского). Различие между ними заключается в том, как измеряется расстояние между двумя точками. Ясно, что в случае МШ от выбора метрики (а значит, того, как будет подсчитано расстояние между стимулами), зависит результат всего исследования, оценки координат стимулов. Отсюда мы имеем «различные пространственные дистанционные модели для данных».

Каким образом исходная матрица различий стимулов преобразуется в оценки координат стимулов? Задача исследователя заключается в выборе функции, которая максимально соответствовала бы первичным данным, и поиске подходящей размерности координатного пространства. Для оценки отклонений координат стимулов от первичных данных используются меры соответствия полученных оценок исходным расстояниям. Эта мера называется «стрессом» (так ее назвал автор, Дж. Краскал), существует три ее разновидности: «стресс, формула 1» (обозначается как S1), «стресс, формула 2» (S2) иS-стресс. Кроме того, стресс помогает определить, какая размерность пространства для полученного решения будет наилучшей. Для этого строится график зависимости меры соответствия («стресса») от размерности пространства. Помимо оценки соответствия существуют другие критерии выбора размерности итогового пространства: интерпретируемость (выбор минимально возможной размерности с интерпретируемыми осями) и воспроизводимость результатов (решение должно включать те оси, которые встречались в различных подвыборках). Все вместе это составляет «методы оценки соответствия этих моделей данным».

Существует три разновидности МШ: метрическое, неметрическое и индивидуальное. Метрическое и неметрическое МШ различаются по уровню измерения исходных данных. Метрическое шкалирование требует метрических данных (получаемых в результате использования абсолютных шкал), а следовательно, непригодно для большей части получаемых социологом первичных эмпирических данных. Неметрическое шкалирование накладывает гораздо меньшие ограничения и позволяет использовать данные более низкого уровня измерения (порядковых шкал). Впервые разделение на метрическое и неметрическое шкалирование, как и сами термины, были введены Кумбсом. Метрическое МШ при построении функции учитывает числовые отношения между объектами, а неметрическое - только их порядок. В случае изучения латентных факторов оценки влиятельности политиков мы использовали неметрическое МШ, так как исходные данные имеют порядковый уровень измерения (ранговая шкала оценок).

Модель индивидуальных различий применялась вначале для изучения степени отличия оценок стимулов у различных людей, отсюда и происходит название. Однако модели индивидуальных различий могут применяться для описания различий, не только между индивидами, в разных областях и позволяют определить вес координат и степень взаимодействия между координатами в субъективном пространстве.

Такова в общем виде процедура МШ. В первую очередь, метод МШ позволяет решить две задачи: получить интегративную оценку исследуемой характеристики (а не ее отдельных аспектов), и определить, не навязывая собственного мнения испытуемым, какими же признаками они руководствовались в процессе оценивания. В нашем случае необходимо было решение обеих этих задач. Принципиально важно было получить общую оценку влиятельности, поскольку оценка составляющих влиятельности не дает возможности получить общую картину. С другой стороны, необходимо было выяснить, какими же критериями руководствуются эксперты, оценивая влиятельность политиков, а не навязывать им собственное видение влиятельности. Предварительное изучение массива, интервью с экспертами показали, что у экспертов существует некоторое общее представление о политической влиятельности и что они принимают во внимание несколько аспектов влиятельности политика. Методы МШ применяются также для понижения размерности и визуализации исходных данных. Все многообразие характеристик, используемых респондентами для оценки стимула, сводится к небольшому количеству общих для всех испытуемых критериев (как правило, двух-трех), что позволяет представить результаты исследования наглядно в двух- или трехмерном пространстве координат.

МШ имеет преимущества по сравнению с другими методами, позволяющими решать данные задачи [3:88, 4:13]. Во-первых, если факторный анализ допускает только линейное проектирование в пространстве меньшей размерности, то в МШ такое ограничение отсутствует. Это сказывается на возможностях интерпретации: вследствие линейных ограничений факторный анализ дает сравнительно большее количество размерностей, чем МШ. Расстояния между пунктами проще интерпретировать, чем углы между векторами. В результате МШ обеспечивает более легкую интерпретируемость решения в пространстве меньшей размерности. Наконец, методы МШ накладывают существенно меньшие ограничения на исходную информацию: факторный анализ требует на входе информации наивысшего уровня измерения - метрического (как известно, большая часть социологической информации таковой не является), в МШ допускается использование информации более низкого уровня измерения. Методы МШ позволяют осуществить анализ предпочтений на индивидуальном уровне, что особенно важно, т.к. индивидуальные предпочтения широко варьируются и анализ средних предпочтений нередко малоинформативен.

МШ может применяться последовательно с другими методами (например, сначала кластерный анализ, затем МШ, как это делал Г. Сатаров при изучении расстановки сил в Конгрессе США [5-7]), или параллельно, уточняя результаты одного метода с помощью использования другого. Как в нашем случае, когда применялось несколько методов многомерного анализа: МШ, кластерный и факторный анализ.

В истории МШ выделяют три этапа. Первый этап – это разработка принципов метрического шкалирования У. Торгерсоном в конце 50-х. Вторая фаза связана с разработкой методики неметрического МШ Р. Шепардом и Дж. Краскалом в начале 60-х. Третий этап Р. Шепард связывает с разработкой моделей для многомерного представления порядковых или неметрических данных Кумбсом [8]. Некоторое время практическое использование МШ отставало от теоретического развития этих методов, что было связано с отсутствием соответствующей вычислительной техники и программного обеспечения. Сегодня ряд статистических пакетов обработки информации (например, SPSS) содержат возможности для анализа методом МШ. С конца 60-х - начала 70-х и далее МШ все более активно начинает использоваться в социальных науках. Появляется масса работ, посвященных развитию методов МШ и их практическому применению [например, доступны российскому читателю 4, 9-13]. В настоящее время существуют многочисленные примеры использования МШ для решения различных социальных задач [14-16]. В последнее время МШ используется в новых областях научного знания и практических сферах – например, для сегментирования рынка [14, Vol.1:184].

Как уже отмечалось, МШ меньше известно российским исследователям, однако говорить об отсутствии соответствующей литературы и практики применения МШ в отечественной науке было бы неправомерно (хотя за последние 10 лет публикаций по МШ в России не появлялось). Практически одновременно с зарубежными странами методы МШ начинают применяться в СССР, появляются работы, посвященные развитию методов МШ и их практическому применению. В отечественной науке сложилось две школы МШ: московская (Г. Сатаров, А. Терехина) и ленинградская (В. Перекрест). У начинающего исследователя есть возможность освоить, с целью последующего самостоятельного применения, данную область социальных исследований, опираясь на работы отечественных авторов, прежде всего Каменского В.С., Косолапова М.С., Сатарова Г.А., Терехиной А.Ю. и других [3, 17-24]. Есть возможность ознакомиться с работами зарубежных авторов на русском языке [2, 25].

В СССР МШ использовалось, например, для изучения структуры НИИ, культурных потребностей, синтаксической структуры простого предложения и структуры межотраслевых поставок [23:7; 26, 27]. К числу последних примеров использования МШ в отечественной практике относятся исследования Г. Сатарова и В. Петрова. Г. Сатаров применил МШ для изучения расстановки сил в Конгрессе США [5-7]. Используя данные поименного голосования в Сенате 1971-1974 гг. двадцати сенаторов, Г. Сатаров выделил факторы, объясняющие позицию сенаторов при голосовании: изоляционизм-глобализм и консерватизм-либерализм. Выборка из 20 сенаторов была определена по результатам изучения общей картины расстановки сил в Сенате посредством кластерного анализа. Позже, в начале 90-х, на основе ранее разработанного подхода Г. Сатаров изучал структуру восприятия и оценки политиков россиянами и политическую структуру Съезда народных депутатов России [28, 29]. Для оценки россиянами 18 политиков использовались пять различных рейтингов. Для трех из них (эмпатии, доверия и эмоциональных оценок) были получены схожие двумерные решения, где определяющим оказалось положение политика относительно Б. Ельцина (ельцинизм-антиельцинизм и тип оппозиции Ельцину).

В. Петров на материале интегральных оценок по 10-балльной шкале пятьюдесятью представителями молодежной аудитории 14 бардов, выделил основные параметры восприятия авторской песни [30]. Данные неметрического МШ сравнивались с данными прямого ранжирования исполнителей (проводились на разных массивах) и показали высокую согласованность. Исследование показало перспективность использования неметрического МШ для исследования латентных параметров сферы культуры. О перспективности использования МШ говорят результаты других отечественных и многочисленных зарубежных исследований.

Наше исследование с применением МШ заключалось в выявлении латентных факторов влиятельности политиков. Об уместности использования МШ для решения задачи было сказано выше. В исследовании подтвердилось отмечавшееся ранее преимущество МШ над другими методами многомерного анализа. Сравнение показало, что решения МШ более компактны и лучше интерпретируются; факторы МШ более постоянны на протяжении всего года, в отличие от результатов факторного анализа. Более того, в МШ во всех подгруппах политиков имеется один общий фактор с близкой к итоговому рейтингу расстановкой политиков, что свидетельствует о высокой степени согласованности результатов МШ с исходными данными.

Изучение латентных факторов оценки влиятельности экспертами проводилось с использованием интегративной концепции лидерства, которая предусматривает всестронний анализ лидерства с акцентом на его публичное восприятие. Влиятельность рассматривается как основной критерий оценки публичного лидера, а рейтинги – как один из главных способов измерения влиятельности. Поэтому считается, что изучение места лидера на политической сцене – сложная задача, а влиятельность рассматривается как сложная интегративная характеристика. Исходя из этого были выдвинуты гипотезы о том, что публичная деятельность является критерием оценки влиятельности влиятельности политика, а личностные и неформальные критерии оценки (публичная деятельность политика, уровень его популярности) являются более значимыми, чем формальные (статус в политической иерархии, характер и величина ресурсов влияния и т.д.).

Стратегия поиска латентных факторов заключалась в следующем. Из-за обширности массива для анализа был выбраны оценки не всех, а только 50-ти первых политиков рейтинга за 1998год (всего – 100 политиков). Связано это с тем, что весь массив очень громоздкий, а во-вторых, оценки политиков в нижней части рейтинга слабо дифференцированы и менее устойчивы, больше подвержены ошибкам измерения, и потому представляют меньший исследовательский интерес. Анализ всех 50-ти политиков дал достаточно громоздкие решения из 9-11 факторов. Поэтому было решено искать группировки политиков и экспертов, для которых существуют решения с меньшим числом факторов. Анализ кластеров и группировок экспертов по различным основаниям оказался безрезультатным, в отличие от гурппировок по формальным основаниям (публичные и закулисные политики, политики федеральной исполнительной власти, политики без должностей, первая 20-ка рейтинга). Результаты МШ формальных группировок политиков за 1998 год показательны. Для всех формальных групп политиков во всех замерах прослеживается фактор, который является доминирующим и во многом предопределяет расклад итогового рейтинга влиятельности - фактор оценки властных полномочий политиков, административного ресурса. Это тот потенциальный ресурс влиятельности, который задается формальной должностью/статусом политика в политической системе и не зависит от его личных особенностей и вклада. Различные позиции в политической иерархии имеют изначально неодинаковый политический вес, что в полной мере подтвердил и репутационный анализ рейтинга НГ [31].

Второстепенный фактор оценки в каждой группе политиков свой. Для публичных политиков это степень общественного интереса к политику (здесь на разных полюсах оказывались А. Масхадов, Ш. Басаев и Г. Селезнев, Е. Строев). Для закулисных – вхождение в структуры политической власти страны (в структуре – вне структуры), для политиков исполнительной власти – принадлежность к правительству или администрации президента (см. график 1).

График 1

В течение почти всего 1998 года (до октября) структурировал пространство первых двадцати политиков фактор реальных властных полномочий (политики, принимающие решения – официальные и теневые советники), а в конце года его место занял фактор отношения к президенту Ельцину (сторонники – противники президента, графики 2, 3).

График 2

График 3

В исследовании полностью подтвердилась гипотеза о том, что публичная деятельность является критерием оценки влиятельности политиков. Но вторая гипотеза – о большей значимости этого фактора по сравнению с формальными - не подтвердилась. В оценке публичных политиков эксперты не всегда ориентируются на деятельность самого политика, она не является главным критерием оценки влиятельности, и что подтвердили и сами эксперты в процессе опроса. По результатам исследования был сделан вывод о недостаточной сформированности пространства публичной политики в России и о том, что публичность пока не стала первостепенным вектором развития политического процесса. Процесс становления демократических процедур продолжается, они еще полностью не закрепились, не стали органической частью политической культуры постсоветского российского общества.

Результаты МШ использовались не только для решения содержательных, но и методических задач. В частности, было необходимо убедиться в уместности использования агрегированной шкалы оценки влиятельности, применяемой в первичном исследовании. Необходимо, чтобы выявленные факторы были однородными и транзитивными. Если же выявленные факторы являются качественно неоднородными, то следует сделать вывод о невозможности использования одномерной шкалы для оценки влиятельности политиков. Это будет свидетельствовать о необходимости перехода к многомерному измерению влиятельности и пересмотру всей методики исследования.

Результаты кластерного анализа и МШ подтвердили предположение, что факторы оценки влиятельности политиков действительно являются качественно однородными. Условие транзитивности также соблюдается. Выявленные в ходе изучения факторы прошли проверку на транзитивность в ходе очередной волны экспертизы влиятельности Независимой газеты в сентябре 2001 г.

Таким образом, наше исследование показало продуктивность использования МШ для решения сложных исследовательских задач, связанных с изучением многомерных социальных характеристик. Преимущества использования МШ очевидны, а компьютерные технологии позволяют облегчить работу социолога. Представляется, что популярность МШ у зарубежных и отечественных социальных ученых будет все больше увеличиваться и использованием этой техники станет таким же привычным, как и методов одномерного шкалирования.

Литература

  1. Например: 100 Ведущих политиков России в июне // НГ-Сценарии. 08.07.1998.

  2. Дейвисон М. Многомерное шкалирование. Методы наглядного представления данных. М.: Финансы и статистика, 1988.

  3. Клигер С.А., Косолапов М.С., Толстова Ю.Н. Шкалирование при сборе и анализе социологической информации. М.: Наука, 1978.

  4. Schiffman S.S., Reynolds M.L., Young F.W. Introduction to Multidimensional scaling. Theory, methods and applications. N.Y.: Academic Press, 1984.

  5. Сатаров Г.А. Применение неметрического многомерного шкалирования при изучении расстановки и соотношения сил в Конгрессе США //Анализ нечисловых данных в системных исследованиях. Сб-к трудов. Вып. 10. М., 1982.

  6. Сатаров Г.А., Станкевич С.Б. Голосования в Конгрессе США // Социологические исследования. 1983. № 1.

  7. Сатаров Г.А., Станкевич С.Б. Идеологическое размежевание в Конгрессе США // Социологические исследования. 1988. № 2.

  8. Shepard R.N. The purpose of multidimensional scaling // Multidimensional scaling. Theory and application in the behavioral sciences. Ed. by Romney A.K., Shepard R.N., Norlove S.B. Vol. 1. N.Y. & L.: Seminar Press, 1972.

  9. Coxon A.P.M. The user’s quid to multidimensional scaling. L.: Heinemann Educational Books, 1982.

  10. Johnson R.M. Paiwise nonmetric multidimensional scaling. Psychometrika. Vol.38 (1):11-18.

  11. Shepard R.N. Multidimensional Scaling, Tree-Fitting and Clustering. Science. 1980.210: 390-398.

  12. Shepard R.N. Presentation of structure in similarity. Data: problems and prospects. Psychometrika. 1974. Vol.39 (4):373-421.

  13. Takane Y., Young F.W. Nonmetriс individual differences multidimensional scaling: An atternating least squares method with optimal scaling features. Psychometrika. 1977. 42 (1): 7-67.

  14. Multidimensional scaling. Theory and application in the behavioral sciences. Ed. by Romney A.K., Shepard R.N., Norlove S.B. Vol. 1, 2. N.Y. & L.: Seminar Press, 1972.

  15. Forgas J.P., Kagan C., Frey D. The Cognitive representation of political personalities. A cross-cultural comparison // International Journal of Psychology. 1977. 12: 19-30.

  16. Rabinowitz G. Multidimensional Scaling & Individual Difference Scaling //New tools for social scientists. Advances & applications in research methods. Ed. by Berry W.D., Lewis-Beck M.S. Beverly Hills, London: Sage publications, 1986.

  17. Бородкин Л.И. Многомерный статистический анализ в исторических исследованиях. М.: Изд-во Московского ун-та, 1986.

  18. Интерпретация и анализ данных в социологических исследованиях. М.: Наука, 1987.

  19. Косолапов М.С. Классификация методов пространственного представления структуры исходных данных // Социологические исследования. 1976. № 2.

  20. Сатаров Г.А. Многомерное шкалирование и другие методы при комплексном анализе данных // Анализ нечисловой информации в социологических исследованиях. М.: Наука, 1985.

  21. Сатаров Г.А. Многомерное шкалирование: новые идеи и пути использования // Статистические методы в общественных науках. Сб-к обзоров. М.: ИНИОН, 1982.

  22. Сатаров Г.А., Каменский В.С. Общий подход к анализу экспертных оценок методами неметрического многомерного шкалирования // Статистические методы анализа экспертных оценок. М.: Наука, 1977.

  23. Терехина А.Ю. Анализ данных методами многомерного шкалирования М.: Наука, 1986.

  24. Шмелев А.Г. Введение в экспериментальную психосемантику: Теоретико-методологические основания и психодиагностические возможности. М.: МГУ, 1983.

  25. Торгерсон В.С. Многомерное шкалирование: теория и метод // Статистические измерения качественных характеристик. М., 1972.

  26. Михеев А.В., Каменский В.С., Петров В.М., Сатаров Г.А. Об использовании неметрического многомерного шкалирования при исследовании потребности в объектах культуры // Модели и методы исследования социально-демографических процессов. М.: Центральный экономико-математический институт АН СССР, 1975.

  27. Панкова Л.А., Терехина А.Ю., Шнейдерман М.В. Классификация научных тем и анализ тематической структуры НИИ на основе экспертных оценок // Статистические методы анализа экспертных оценок. М.: Наука, 1977.

  28. Сатаров Г.А. Анализ политической структуры законодательных органов по результатам поименных голосований // Российский монитор. Архив современной политики. 1992. Вып. 1.

  29. Сатаров Г.А. Политическая жизнь через призму установок населения: структурные рейтинги // Российский монитор. Архив современной политики. 1992. Вып. 1.

  30. Петров В.М. Опыт применения неметрического многомерного шкалирования при изучении предпочтений молодежи в области авторской песни // Социология 4 М. 1991. № 1.

  31. Ривера Ш.В. Тенденции формирования посткоммунистической элиты России: репутационный анализ // Полис. 1995. № 6.

Сведения об авторе:

Хазеева Наталия Минияновна. Аспирантка Государственного университета гуманитарных наук (Москва)

Статья знакомит с одни из малоизвестных методов многомерного анализа – многомерным шкалированием. В ней дается подробное определение метода, рассматриваются его разновидности, преимущества и случаи применения; представлена история метода и обзор доступных российскому читателю литературы и эмпирических исследований. На примере рейтинга влиятельности политиков Независимой газеты за 1998 год продемонстрированы возможности использования метода в социологических исследованиях.

The article introduced one of the rarely used methods of multidimensional research – multidimensional scaling. The article gives detailed definition of the method, observes its types, advantages and fields of application; presents history and review of literature and studies available in Russia. The “Nezavisimaya gazeta” rating of politicians’ influence showcases the possibility of applying multidimensional scaling in social research.

 
Оригинал текста доступен для загрузки на странице содержания