Раздел 7. Параметрические критерии сравнения выборок.
Параметрические критерии. 1. Методы сравнения двух выборок по признаку, измеренному в метрической шкале. Распределение признака в выборке приблизительно соответствует нормальному виду. 2. Построены на основании параметров данной совокупности (например, х и s2x) . и представляющие функции этих параметров; служат для проверки гипотез о параметрах совокупностей, распределяемых по нормальному закону. Независимые выборки. 1. Выборки, которые характеризуются тем, что вероятность отбора любого испытуемого одной выборки не зависит от отбора любого из испытуемых другой выборки. 2. Допущение независимости предполагает, что представители двух выборок не составляют пары коррелирующих значений признака. Зависимые выборки. 1. Выборки, характеризующиеся тем, что каждому испытуемому одной выборки поставлен в соответствие по определенному критерию испытуемый из другой выборки. 2. Допущение зависимости чаще всего означает, что признак измерен на одной и той же выборке дважды, например, до воздействия и после него. Более слабые виды зависимости выборок: выборка 1 – мужья, выборка 2 – их жены; выборка 1 – годовалые дети, выборка 2 – близнецы детей выборки. Критерий t Стьюдента (t, tst; критерий Стьюдента; Student's t-test). Критерий для определения статистической значимости различий двух средних значений. Одновыборочный критерий t Стьюдента (t, tst; критерий Стьюдента). 1. Параметрический критерий, позволяющий проверить гипотезу о том, что среднее значение изучаемого признака отличается от некоторого известного значения [5. С. 164]. 2. Критерий, предназначенных для сравнения среднего значения распределения переменной с некоторой эталонной величиной. Критерий t Стьюдента для независимых выборок (t, tst; критерий Стьюдента). Параметрический критерий, позволяющий проверить гипотезу о том, что средние значения двух совокупностей, их которых извлечены сравниваемые независимые выборки, отличаются друг от друга. Критерий t Стьюдента для зависимых выборок (t, tst; критерий Стьюдента). Параметрический критерий, позволяющий проверить гипотезу о том, что средние значения двух совокупностей, из которых извлечены сравниваемые зависимые выборки, отличаются друг от друга. Исследовательские задачи: Одновыборочный критерий t Стьюдента: • сравнение уровня IQ у студентов 1 курса со стандартным Мх=100 (тест David Wechsler (WAIS); • сравнение уровня экстраверсии/интроверсии у подростков со стандартным средним значением Мх=12 (тест Hans J. Eysenck). Критерий t Стьюдента для независимых выборок: • сравнение уровня агрессивности подростков из полной и неполной семьи (опросник Arnold H. Buss, Ann Durkee); • сравнение уровня эмоционального выгорания у студентов 1 и 4 курса (опросник В.В. Бойко).
Критерий t Стьюдента для зависимых выборок: • сравнение уровня эмоциональной устойчивости у педагогов со стажем <5 и >15 лет (тест Hans J. Eysenck); • сравнение выраженности стратегии поведения в конфликте «соперничество» у работников торговой сферы до и после тренинга (опросник K. Thomas).
Требования к выборке: • объем выборки исследования: - при использовании одновыборочного критерия t n≥30; - при использовании t для зависимых и независимых выборок n1≥30 и n2≥30; • распределение: должно соответствовать нормальному виду.
ПОШАГОВОЕ ВЫПОЛНЕНИЕ
Файл-пример: SPSS Параметрические критерии.sav Откройте файл SPSS Параметрические критерии.sav в программе IBM SPSS Statistics 19.
В файле представлены результаты диагностики черт личности школьников с разным уровнем успеваемости (методика 16 PF Кеттелла; n=98).
В анализе участвуют следующие переменные:
пол : 1 – женский, 2 – мужской; класс : 1 – 9 класс, 2 – 10 класс, 3 – 11 класс; Аугруппа : 1 – неуспевающие, 2 – среднеуспевающие, 3 – успевающие; А_до : общительность до проведения тренинга; B : интеллект; C_до : эмоциональная устойчивость до проведения тренинга; А_после : общительности после проведения тренинга; С_после : эмоциональная устойчивость после проведения тренинга; успеваемость : академическая успеваемость.
I. Критерий t Стьюдента для одной выборки
Выполните следующий порядок действий:
Шаг 1 На панели инструментов выберите меню Анализ→Сравнение средних→Одновыборочный t-критерий.
Шаг 2 В меню Одновыборочный T-критерий (рис. 19) перенесите из левого окна переменную успеваемость в окно Проверяемые переменные: .
Шаг 3 В ячейке Проверяемое значение: введите цифру 4 и нажмите ОК.
Таким образом, полученное в исследовании Мх успеваемости сравнивается с заданным стандартным значением Мх = 4 балла.
ОПИСАНИЕ И ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ
1) В открывшемся окне Вывод представлены результаты сравнения эмпирического уровня успеваемости с заданным стандартным уровнем. Описанию и интерпретации подлежит таблица под заголовком Одновыборочный t-критерий (см. ниже): - в столбце t – значение критерия t, - в столбце Значимость (2-сторонняя) – уровень значимости различий p.
Одновыборочный t-критерий
Проверяемое значение = 4 t ст.св. Значимость (2-сторонняя) Разность средних 95% доверительный интервал разности средних Нижняя граница Верхняя граница Успеваемость -2,996 97 ,003 -,1959 -,326 -,066
2) Так как целью использования одновыборочного критерия t является установление значимости различий между стандартным и эмпирическим значениями, при интерпретации результатов необходимо, в первую очередь, обратиться к показателю p-уровня: - если p-уровень ≤0,05, то различия между эмпирическим и стандартным значениями являются статистически значимыми; - если p-уровень >0,05, то различия между эмпирическим и стандартным значениями являются статистически не значимыми.
3) После установления уровня значимости различий необходимо определить направление различий – эмпирическое значение больше или меньше стандартного: - если перед значением t-критерия стоит знак «-» (в нашем примере t= -2,996), то эмпирическое значение ниже уровня стандартного значения; - если перед значением t-критерия стоит знак «+», то эмпирическое значение выше уровня стандартного значения.
4) В нашем примере результат подсчета следующий: так как значение p-уровня ≤0,05, а значение t-критерия = -2,996, следует сделать вывод о том, что уровень успеваемости в старших классах статистически значимо ниже заданного стандартного уровня в 4 балла.
II. Критерий t Стьюдента для независимых выборок
Выполните следующий порядок действий:
Шаг 1 На панели инструментов выберите меню Анализ→Сравнение средних→T-критерий для езависимых выборок.
Шаг 2 В меню T-критерий для независимых выборок (рис. 20) перенесите из левого окна переменные А_до, В и С_до в окно Проверяемые переменные.
Шаг 3 В открытом меню T-критерий для независимых выборок перенесите из левого окна переменную пол в окно Группировать по: и выберите команду Задать группы.
Шаг 4 В открытом меню Задать группы (рис. 21) в ячейке Группа 1: установите число 1, в ячейке Группа 2 установите число 2. Нажмите Продолжить и ОК.
Таким образом в меню Задать группы была определена градация выборки по полу.
ОПИСАНИЕ И ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ
1) В открывшемся окне Вывод представлены результаты сравнения уровня выраженности черт личности учащихся женского и мужского пола до тренинга (переменные А_до и С_до), а также уровня выраженности черты B (интеллект). Описанию и интерпретации подлежит таблица под заголовком Критерий для независимых выборок (см. ниже): - в столбце t – значение критерия t, - в столбце Значимость (2-сторонняя) – уровень значимости различий p.
2) Перед тем, как приступить к интерпретации результатов использования t-критерия, необходимо выбрать тип t-критерия. Основой для типологии выступает наличие или отсутствие равенства дисперсий двух сравниваемых распределений значений (см. строки таблицы Предполагается равенство дисперсий и Равенство дисперсий не предполагается): - если p-уровень критерия Ливиня ≤0,05 (столбец Знч. группы столбцов Критерий равенства дисперсий Ливиня), то дисперсии сравниваемых распределений значений статистически достоверно различаются, и принимается решение о выборе второго типа t-критерия – в строке Равенство дисперсий не предполагается; - если p-уровень критерия Ливиня >0,05 (как в нашем примере – p=0,822, то есть р>0,05), то дисперсии сравниваемых распределений значений статистически достоверно не различаются, и принимается решение о выборе первого типа t-критерия – в строке Предполагается равенство дисперсий.
3) Выбрав тип t-критерия, можно сделать вывод о значимости различий между сравниваемыми выборками: - если p-уровень ≤0,05, то различия между выборками являются статистически значимыми; - если p-уровень >0,05, то различия между выборками являются статистически не значимыми.
4) После установления уровня значимости различий необходимо определить направление различий – уровень выраженности в какой из сравниваемых групп выше и ниже. Порядок определения направления различий идентичен тому, что был описан в отношении t-критерия Стьюдента для одной выборки.
5) В нашем примере результат подсчета следующий: - для переменной А_до : так как p-уровень критерия Ливиня >0,05, нами был выбран тот тип t- критерия, для которого предполагается равенство дисперсий. В нашем примере p-уровень t-критерия >0,05, поэтому статистически значимых различий между женской и мужской выборкой в уровне выраженности черты А_до нет. Можно говорить лишь о незначительно большем уровне выраженности черты А_до в женской выборке, так как значение t-критерия =0,375 (т.к. знак положительный); - логика и порядок описания результатов использования t-критерия для переменных B и C_до идентичны приведенному примеру для переменной А_до.
III. Критерий t Стьюдента для зависимых выборок
Выполните следующий порядок действий:
Шаг 1 На панели инструментов выберите меню Анализ→Сравнение средних→t-критерий для парных выборок.
Шаг 2 В меню T-критерий для парных выборок (рис. 22) перенесите из левого окна поочередно переменные А_до и А_после в окно Парные переменные: . В окне Парные переменные: должна быть сформирована Пара, состоящая из переменных [А_до] и [А_после]. Далее нажмите ОК.
Количество пар, которые программа может одновременно сравнить, больше 50-ти.
ОПИСАНИЕ И ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ
1) В открывшемся окне Вывод представлены результаты сравнения уровня выраженности черты А до и после тренинга. Описанию и интерпретации подлежит таблица под заголовком Критерий парных выборок (см. ниже): - в столбце t – значение критерия t, - в столбце Значимость (2-сторонняя) – уровень значимости различий p). Для удобства восприятия и работы с таблицей она была отредактирована – удалены не существенные для описания результатов показатели.
Критерий парных выборок
t ст.св. Значимость (2-сторонняя) Пара 1 A_до – А_после -2,184 97 ,031
2) Порядок и логика описания и интерпретации результатов подсчета t-критерия аналогичны тому, как это производилось в отношении двух предыдущих t-критериев.
3) В нашем примере результат анализа следующий: - так как значение p-уровня ≤0,05, можно сделать вывод о статистически значимых различиях в уровне выраженности черты А до и после тренинга; - учитывая, что значение t-критерия отрицательное = -2,184, можно говорить о статистически значимом росте значений черты А после проведения тренинга; то есть проведенный тренинг оказался эффективным.
ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ
Задание 1.
Файл-пример: SPSS Параметрические критерии.sav Откройте файл SPSS Параметрические критерии.sav в программе IBM SPSS Statistics 19.
1) Определите влияние тренинга на уровень выраженности черты С (переменная С_после), выбрав в качестве стандартного уровень выраженности 7 баллов. 2) Опишите и проинтерпретируйте полученный результат исходя из рассмотренного в параграфе способа анализа данных.
Задание 2. Файл-пример: SPSS Параметрические критерии.sav Откройте файл SPSS Параметрические критерии.sav в программе IBM SPSS Statistics 19.
1) Сравните уровень выраженности черт А, С и академической успеваемости в выборках учащихся 10 и 11 класса после проведения тренинга (переменные А_после, С_после, АУ). 2) Перед началом выполнения процедуры анализа примите решение о типе сравниваемых выборок – зависимые или независимые. 3) Опишите и проинтерпретируйте полученный результат исходя из рассмотренного в параграфе способа анализа данных. Задание 3. Файл-пример: SPSS Параметрические критерии.sav Откройте файл SPSS Параметрические критерии.sav в программе IBM SPSS Statistics 19. 1) Сравните уровень выраженности черт А и С до и после тренинга. 2) Перед началом выполнения процедуры анализа примите решение о типе сравниваемых выборок – зависимые или независимые. 3) Опишите и проинтерпретируйте полученный результат исходя из рассмотренного в параграфе способа анализа данных.
КРАТКОЕ ОПИСАНИЕ ИСПОЛЬЗУЕМЫХ ПРОЦЕДУР АНАЛИЗА 1) Условия выбора критериев. Перед началом статистического анализа данных необходимо помнить два главных условия, определяющих выбор параметрических или непараметрических критериев: объем выборки и нормальность распределения: а) если объем выборки n≥30, а распределение значений соответствует нормальному, принимается решение о выборе параметрических критериев; б) если объем выборки n≥30, а распределение значений не соответствует нормальному, то принимается решение о выборе непараметрических критериев; в) если объем выборки n<30, то можно не проверять распределение на нормальность и переходить к использованию непараметрических критериев. 2) Параметрические и непараметрические критерии. При описании и интерпретации результатов, полученных в ходе использования того или иного параметрического или непараметрического критерия, важно учитывать одно из наиболее существенных различий между ними: параметрические критерии более чувствительны к различиям между сравниваемыми выборками, так как сравниваются средние значения, а не дисперсии, ранги, серии и т.п. 3) Зависимые и независимые выборки. Выбирая тип критерия, используемого для сравнения зависимых или независимых выборок, необходимо учитывать условия зависимости/независимости выборок: а) можно логически определить к какому типу относятся выборки – например: - если сравниваются представители одной и той же социальной, учебной, профессиональной и т.п. группы, которые находятся в постоянном взаимодействии друг с другом (девочки и мальчики в 8классе, работники с разным стажем работы в одном учреждении, супруги, дети и т.п.), то выборки являются зависимыми; - если сравниваются представители разных групп, в ограниченном объеме взаимодействующие друг с другом (ученики разных классов, учителя и врачи, дети из полных и неполных семей и т.п.), то выборки являются независимыми; б) если нет возможности однозначно определить степень зависимости сравниваемых групп, то следует использовать методы корреляционного анализа (подробнее см. § 8): - если между сравниваемыми выборками наблюдается высокая положительная корреляция, то выборки являются зависимыми; - если между сравниваемыми выборками уровень корреляции ниже или равен среднему (r≤0,69), то выборки являются независимыми.
|