StatSoft
StatSoft

 

Часть2: Анализ анкет в STATISTICA

После того, как мы отсканировали анкеты, записали результаты в базу данных и научились извлекать эти данные в STATISTICA, можно перейти к следующему этапу: анализу данных, в чем собственно и заключалась цель анкетирования.

Первоначальный анализ данных анкет можно проводить в модуле :

Непараметрическая статистика: all. sta
Рис.1. Непараметрическая статистика: all.sta

Рассмотрим третий пункт (Корреляции). Это относится к так называевым ранговым корреляциям. Например, в анкете есть вопрос, где просят выставить оценку запаху и цвету какого-либо продукту, это и есть ранги. Далее, чтобы узнать насколько зависят друг от друга эти оценки, необходимо вычислить .

Как трактовать полученный коэффициент корреляции? Во-первых коэффициент корреляций должен быть значим, в этом случае он будет выделен в результирующей таблице красным цветом. Далее мы смотрим на его значение, чем его значение по модулю ближе к единице, тем больше линейная взаимосвязь между ними.

Вновь обратимся к . После корреляций стоит четыре пункта сравнения групп. Например, при проведении внутреннего панельного исследования сравнивались два разных сорта, при этом каждым участником была выставлена общая оценка для каждого сорта. И теперь нам нужно сравнить эти оценки. Можно конечно вычислить средние или медианы для каждого сорта вина и просто сравнить их, но в этом случае мы не учтем разброс (дисперсию) оценок. Проведем этот анализ с помощью Непараметрической статистики. У нас две зависимых переменных (2 сорта вина), поэтому выбираем пункт Сравнение двух зависимых переменных. Далее нажимаем кнопку Переменные и в появившемся диалоге в левом списке выбираем переменную с оценками для 1 сорта вина, в правом для 2го сорта вина, нажимаем ОК. Нажимаем на кнопку Критерий Вилкоксона. Появляется таблица с результатами:

Таблица с результатами
Рис.2. Таблица с результатами

Во-первых запись в таблице не выделена красным цветом, во-вторых значение p-уровня равно 0.4, что намного больше значения 0.05. Следовательно критерий нам говорит, что группы не различаются, т.е. общие оценки равны. Чтобы разобраться с этой ситуацией построим диаграмму размаха:

Диаграмма размаха
Рис.3. Диаграмма размаха*

Маленькие квадраты в центре обозначают средние оценки, большие квадраты - границы верхнего и нижнего процентилей. Как мы видим из графика оценки практически полностью совпали, что согласуется с выводами критерия.

Теперь рассмотрим исследование двух других сортов вина. Результаты:

Таблица с результатами
Рис.4. Таблица с результатами

Строка в таблице выделена красным цветом, значение p-уровня равно 0.0027, что намного меньше значения 0.05. Отсюда можно сделать вывод, что согласно критерию Вилкоксона оценки для этих сортов вин отличаются друг от друга. Обратимся теперь к диаграмме размаха:

Диаграмма размаха
Рис.5. Диаграмма размаха

На диаграмме размаха видно, что оценки для второго сорта были более низкие, чем для второго.

Что касается пункта Сравнение нескольких независимых групп, то его применение аналогично разобранному, только он применяется, когда вы хотите сравнить более двух переменных, например, три сорта вин.

В непараметрической статистике также представляет интерес Q критерий Кохрена. Он позволяет сравнивать более двух групп зависимых выборок, которые могут принимать только два значения (например, Да или Нет). Например вы проводите анкетирование одной группы людей осенью, зимой и летом, и вам нужно знать, изменились ли результаты опроса с течением времени.

Рассмотрим следующий пример. Положим, вы интересуетесь эффектом, какое влияние оказывает стиль интервьюера на число респондентов, согласившихся дать ответы на деликатные вопросы в очном опросе. Заметим, что всегда трудно получить ответы на такие деликатные вопросы, как, например, финансовое положение или здоровье в таких опросах, и возможно, вы захотите выяснить, повышает или нет, стиль задания вопросов интенсивность ответов (т.е. уменьшается ли количество отказавшихся отвечать). Для этой цели, можно научить интервьюера проводить интервью в одном из следующих стилей (1) восторженно, дружелюбно и заинтересовано (Interview 1), (2) очень сдержанно и формально (Interview 2), (3) беспристрастно и резко (Interview 3). Затем вы могли бы выбрать 18 троек семей, которые были ранее осторожны в своих ответах, и случайным образом приписать три семейства в каждом наборе к одному из трех стилей, в каком с ними будет проводиться интервью. Зависимая переменная определяет удачу (1-Да - 1-Yes) или неудачу интервью (0-Нет - 0-No).

Данные этого примера находятся в файле Interview.sta, входящий в комплект стандартных примеров, который устанавливается вместе со STATISTICA:

 Данные: Interview.sta
Рис.6. Данные: Interview.sta

В стартовой панели выбираем все переменные:

 Q критерий Кохрена: Interview.sta
Рис.7. Q критерий Кохрена: Interview.sta

Нажимаем кнопку ОК. Тогда появится таблица результатов:

 Данные: Кохрена Q критерий (Interview. sta)
Рис.8. Данные: Кохрена Q критерий (Interview. sta)

Сразу обращаем внимание на уровень значимости в таблице p=0,00024, это говорит нам о том, что группы отличаются друг от друга. Самая правая колонка показывает процент семей, которые раскрыли свою личную информацию (Процент 1). Интересно отметить, что не обнаружено различия в эффективности между первым стилем: восторженно, дружелюбно и заинтересованно (переменная Intrvw_1) и вторым: (2) очень сдержанно и формально (Intrvw_2), таким образом, выражение интереса интервьюером, кажется, не имеет значения. Однако число отказавшихся отвечать увеличилось, когда использовалось интервью третьего типа: беспристрастно и резко (Intrvw_3). А теперь построим диаграмму размаха для иллюстрации:

Диаграмма размаха (Interview. sta 3v*19c)
Рис.9. Диаграмма размаха (Interview. sta 3v*19c)

Как вы можете заметить, этот график очень хорошо согласуется с аналитическими результатами.

Все изложенные выше методы анализа это всего лишь 1% возможностей STATISTICA в анализе данных. Для более глубокого анкетного анализа в STATISTICA существует большое число методов. Например, в дальнейших анкетных опросах вы хотите добавить новые вопросы и убрать лишние, в этом вам поможет .

наверх