Навигация по странице:
|
лекции по псих-пед исслед. Курс лекций орел 2002 Образцов П. И. Методология и методы психологопедагогического исследования Курс лекций. Орел, 2002. 292 с
Статистическая проверка научной гипотезы. Доказательство статистической достоверности экспериментального влияния существенно отличается от доказательства в математике и формальной логике, где выводы носят более универсальный характер: статистические доказательства не являются столь строгими и окончательными – в них всегда допускается риск ошибиться в выводах и потому статистическими методами не доказывается окончательно правомерность того или иного вывода, а показывается мера правдоподобности принятия той или иной гипотезы.
Педагогическая гипотеза (научное предположение о преимуществе того или иного метода и т. п.) в процессе статистического анализа переводится на язык статистической науки и заново формулируется, по меньшей мере, в виде двух статистических гипотез. Первая (основная) называется нулевой гипотезой (Н0), в которой исследователь говорит о своей исходной позиции. Он (априори) как бы декларирует, что новый (предполагаемый им, его коллегами или оппонентами) метод не обладает какими-либо преимуществами, и потому с самого начала исследователь психологически готов занять честную научную позицию: различия между новым и старым методами объявляются равными нулю. В другой, альтернативной гипотезе (Н1) делается предположение о преимуществе нового метода. Иногда выдвигается несколько альтернативных гипотез с соответствующими обозначениями.
Например, гипотеза о преимуществе старого метода (H2). Альтернативные гипотезы принимаются тогда и только тогда, когда опровергается нулевая гипотеза. Это бывает в случаях, когда различия, скажем, в средних арифметических экспериментальной и контрольной групп настолько значимы (статистически достоверны), что риск ошибки отвергнуть нулевую гипотезу и принять альтернативную не превышает одного из трех принятых уровней значимости статистического вывода:
– первый уровень – 5% (в научных текстах пишут иногда р = 5% или а≤0,05, если представлено в долях), где допускается риск ошибки в выводе в пяти случаях из ста теоретически возможных таких же экспериментов при строго случайном отборе испытуемых для каждого эксперимента;
– второй уровень – 1%, т. е. соответственно допускается риск ошибиться только в одном случае из ста (а≤0,01, при тех же требованиях);
– третий уровень – 0,1%, т. е. допускается риск ошибиться только в одном случае из тысячи (а≤0,001). Последний уровень значимости предъявляет очень высокие требования к обоснованию достоверности результатов эксперимента и потому редко используется.
При сравнении средних арифметических экспериментальной и контрольной групп важно не только определить, какая средняя больше, но и насколько больше. Чем меньше разница между ними, тем более приемлемой окажется нулевая гипотеза об отсутствии статистически значимых (достоверных) различий. В отличие от мышления на уровне обыденного сознания, склонного воспринимать полученную в результате опыта разность средних как факт и основание для вывода, педагог-исследователь, знакомый с логикой статистического вывода, не будет торопиться в таких случаях. Он скорее всего сделает предположение о случайности различий, выдвинет нулевую гипотезу об отсутствии достоверных различий в результатах экспериментальной и контрольной групп и лишь после опровержения нулевой гипотезы примет альтернативную.
Таким образом, вопрос о различиях в рамках научного мышления переводится в другую плоскость. Дело не только в различиях (они почти всегда есть), а в величине этих различий и отсюда – в определении той разницы и границы, после которого можно сказать: да, различия неслучайны, они статистически достоверны, а значит, испытуемые этих двух групп принадлежат после эксперимента уже не к одной (как раньше), а к двум различным генеральным совокупностям и что уровень подготовленности учащихся, потенциально принадлежащих этим совокупностям, будет существенно отличаться. Для того чтобы показать границы этих различий, используются так называемые оценки генеральных параметров.
Рассмотрим на конкретном примере (см. табл. 6.6), как с помощью математической статистики можно опровергнуть или подтвердить нулевую гипотезу.
Допустим, необходимо определить зависит ли эффективность групповой деятельности студентов от уровня развития в учебной группе межличностных отношений. В качестве нулевой гипотезы выдвигается предположение, что такой зависимости не существует, а в качестве альтернативной – зависимость существует. Для этих целей сравниваются результаты эффективности деятельности в двух группах, одна из которых в этом случае выступает в качестве экспериментальной, а вторая – контрольной. Чтобы определить, является ли разность между средними значениями показателей эффективности в первой и во второй группе существенной (значимой), необходимо вычислить статистическую достоверность этой разницы. Для этого можно использовать t – критерий Стьюдента. Он вычисляется по формуле:
; (5)
где X1 и X2 – среднее арифметическое значение переменных в группах 1 и 2; М1 и М2 – величины средних ошибок, которые вычисляются по формуле:
; (6)
где s - средняя квадратическая, вычисляемая по формуле (2).
Определим ошибки для первого ряда (экспериментальная группа) и второго ряда (контрольная группа):
,
.
Находим значение t – критерия по формуле:
.
Вычислив величину t – критерия, требуется по специальной таблице определить уровень статистической значимости различий между средними показателями эффективности деятельности в экспериментальной и контрольной группах. Чем выше значение t – критерия, тем выше значимость различий.
Для этого t расчетное сравниваем с t табличным. Табличное значение выбирается с учетом выбранного уровня достоверности (p = 0,05 или p = 0,01), а также в зависимости от числа степеней свободы, которое находится по формуле:
; (7)
где U – число степеней свободы; N1 и N2 – число замеров в первом и во втором рядах. В нашем примере U = 7 + 7 –2 = 12.
№
п/п
|
Экспериментальная группа
|
Контрольная группа
|
Значение эффек-тивности деятельности
|
|
|
Значение эффек-тивности деятельности
|
|
|
1
2
3
4
5
6
7
|
5
6
7
10
6
8
7
|
2
1
0
–3
1
–1
0
|
4
1
0
9
1
1
0
|
6
3
4
5
5
3
2
|
–2
1
0
–1
–1
1
2
|
4
1
0
1
1
1
4
|
|
|
|
|
|
|
|
|
Для таблицы t – критерия находим, что значение t табл. = 3,055 для однопроцентного уровня (p < 0,01) при 12 степенях свободы. Таким образом, величина t табл. < t расч. Таким образом, можно сделать статистически обоснованный вывод о том, что эффективность деятельности в экспериментальной группе выше, чем в контрольной, при уровне значимости 0,01 (риск ошибки составляет одна из ста теоретически возможных).
Однако педагогу-исследователю следует помнить, что существование статистической значимости разности средних значений является важным, но не единственным аргументом в пользу наличия или отсутствия связи (зависимости) между явлениями или переменными. Поэтому необходимо привлекать и другие аргументы количественного или содержательного обоснования возможной связи.
Многомерные методы анализа данных. Анализ взаимосвязи между большим количеством переменных осуществляется путем использования многомерных методов статистической обработки. Цель применения подобных методов – сделать наглядными скрытые закономерности, выделить наиболее существенные взаимосвязи между переменными. Примерами таких многомерных статистических методов являются:
– факторный анализ;
– кластерный анализ;
– дисперсионный анализ;
– регрессионный анализ;
– латентно-структурный анализ;
– многомерное шкалирование и другие.
Факторный анализ заключается в выявлении и интерпретации факторов. Фактор – обобщенная переменная, которая позволяет свернуть часть информации, т. е. представить ее в удобообозримом виде. Например, факторная теория личности выделяет ряд обобщенных характеристик поведения, которые в данном случае называются чертами личности.
Кластерный анализ позволяет выделить ведущий признак и иерархию взаимосвязей признаков.
Дисперсионный анализ – статистический метод, используемый для изучения одной или нескольких одновременно действующих и независимых переменных на изменчивость наблюдаемого признака. Его особенность состоит в том, что наблюдаемый признак может быть только количественным, в тоже время объясняющие признаки могут быть как количественными, так и качественными.
Регрессионный анализ позволяет выявить количественную (численную) зависимость среднего значения изменений результативного признака (объясняемой) от изменений одного или нескольких признаков (объясняющих переменных). Как правило данный вид анализа применяется тогда, когда требуется выяснить насколько изменяется средняя величина одного признака при изменении на единицу другого признака.
Латентно-структурный анализ представляет совокупность аналитико-статистических процедур выявления скрытых переменных (признаков), а также внутренней структуры связей между ними. Он дает возможность исследовать проявления сложных взаимосвязей непосредственно ненаблюдаемых характеристик социально-психологических и педагогических явлений. Латентный анализ может являться основой для моделирования указанных взаимосвязей.
Многомерное шкалирование обеспечивает наглядную оценку сходства или различия между некоторыми объектами, описываемыми большим количеством разнообразных переменных. Эти различия представляются в виде расстояния между оцениваемыми объектами в многомерном пространстве.
6.2. Статистическая обработка результатов психолого-педагогических
исследований
В любом исследовании всегда важно обеспечить массовость и представительность (репрезентативность) объектов изучения. Для решения этого вопроса обычно прибегают к математическим методам расчета минимальной величины подлежащих исследованию объектов (групп респондентов), чтобы на этом основании можно было сделать объективные выводы.
По степени полноты охвата первичных единиц статистика делит исследования на сплошные, когда изучаются все единицы изучаемого явления, и выборочные, если изучению подвергается только часть интересующей совокупности, взятая по какому-либо признаку. Исследователю не всегда представляется возможность изучить всю совокупность явлений, хотя к этому постоянно следует стремиться (не хватает времени, средств, необходимых условий и т. д.); с другой стороны, часто сплошное исследование просто не требуется, так как выводы будут достаточно точными после изучения определенной части первичных единиц.
Теоретической основой выборочного способа исследования является теория вероятностей и закон больших чисел. Чтобы исследование располагало достаточным количеством фактов, наблюдений, используют таблицу достаточно больших чисел. От исследователя в данном случае требуется установление величины вероятности и величины допускаемой ошибки. Пусть, например, допускаемая ошибка в выводах, которые должны быть сделаны в результате наблюдений, по сравнению с теоретическими предположениями, не должна превышать 0,05 как в положительную, так и в отрицательную стороны (иначе говоря, мы можем ошибиться не более чем в 5 случаев из 100). Тогда по таблице достаточно больших чисел (см. табл. 6.7)1 находим, что правильное заключение может быть высказано в 9 случаев из 10 тогда, когда число наблюдений будет не менее 270, в 99 случаев из 100 при наличии не менее 663 наблюдений и т. д. Значит, с увеличением точности и вероятности, с которой мы предполагаем сделать выводы, число требуемых наблюдений возрастает. Однако в психолого-педагогическом исследовании оно не должно быть чрезмерно большим. 300–500 наблюдений часто является вполне достаточным для основательных выводов.
Данный способ определения величины выборки является наиболее простым. Математическая статистика располагает и более сложными методами вычисления требуемых выборочных совокупностей, которые подробно освещены в специальной литературе.
Однако соблюдение требований массовости еще не обеспечивает надежности выводов. Они будут достоверны тогда, когда выбранные для наблюдения (бесед, эксперимента и т. д.) единицы являются достаточно представительными для изучаемого класса явлений.
Таблица 6.7
Краткая таблица достаточно больших чисел
Величина
вероятности
Допустимая
ошибка
|
0,85
|
0,90
|
0,95
|
0,99
|
0,995
|
0,999
|
10,05
|
207
|
270
|
384
|
663
|
787
|
1082
|
10,04
|
323
|
422
|
600
|
1036
|
1231
|
1691
|
10,03
|
575
|
751
|
1067
|
1843
|
2188
|
3007
|
10,02
|
1295
|
1691
|
2400
|
4146
|
4924
|
6767
|
10,01
|
5180
|
6764
|
9603
|
16587
|
19699
|
27069
|
Репрезентативность единиц наблюдения обеспечивается прежде всего их случайным выбором с помощью таблиц случайных чисел. Положим, требуется определить 20 учебных групп для проведения массового эксперимента из имеющихся 200. Для этого составляется список всех групп, который нумеруется. Затем из таблицы случайных чисел выписывается 20 номеров, начиная с какого-либо числа, через определенный интервал. Эти 20 случайных чисел по соблюдению номеров определяют те группы, которые нужны исследователю. Случайный выбор объектов из общей (генеральной) совокупности дает основание утверждать, что полученные при исследовании выборочной совокупности единиц результаты не будут резко отличаться от тех, которые имелись бы в случае исследования всей совокупности единиц.
В практике психолого-педагогических исследований применяются не только простые случайные отборы, но и более сложные методы отбора: расслоенный случайный отбор, многоступенчатый отбор и др.
Математические и статистические методы исследования являются также средствами получения нового фактического материала. С этой целью используются приемы шаблонирования, повышающие информативную емкость анкетного вопроса и шкалирования, дающего возможность более точно оценивать действия как исследователя, так и исследуемых.
Шкалы возникли из-за необходимости объективно и точно диагностировать и измерять интенсивность определенных психолого-педагогических явлений. Шкалирование дает возможность упорядочить явления, количественно оценить каждое из них, определить низшую и высшую ступени исследуемого явления.
Так при исследовании познавательных интересов слушателей можно установить их границы: очень большой интерес – очень слабый интерес. Между этими границами ввести ряд ступеней, создающих шкалу познавательных интересов: очень большой интерес (1); большой интерес (2); средний (3); слабый (4); очень слабый (5).
В психолого-педагогических исследованиях используются шкалы разных видов, например,
а) Трехмерная шкала
Очень активный……..…………..10
Активный…………………………5
Пассивный…...…………………...0
б) Многомерная шкала
Очень активный…………………..8
Среднеактивный………………….6
Не слишком активный…………...4
Пассивный………………………..2
Полностью пассивный…………...0
в) Двусторонняя шкала.
Очень интересуется……………..10
Достаточно интересуется………...5
Равнодушен……………………….0
Не интересуется…………………..5
Совершенно нет интереса………10
Числовые оценочные шкалы дают каждому пункту определенное числовое обозначение. Так, при анализе отношения студентов к учебе, их настойчивости в работе, готовности к сотрудничеству и т.п. можно составить числовую шкалу на основе таких показателей: 1 – неудовлетворительно; 2 – слабо; 3 – средне; 4 – выше среднего, 5 – намного выше среднего. В таком случае шкала приобретает следующий вид (см. табл. 6.8):
Таблица 6.8
Качество
|
Степени качества
|
Отношение к учебе
|
1
|
2
|
3
|
4
|
5
|
Настойчивость в труде
|
1
|
2
|
3
|
4
|
5
|
Готовность к сотрудничеству
|
1
|
2
|
3
|
4
|
5
|
Аккуратность в выполнении заданий
|
1
|
2
|
3
|
4
|
5
|
Целеустремленность
|
1
|
2
|
3
|
4
|
5
|
Если числовая шкала биполярна, используется биполярная упорядоченность с нулевой величиной в центре:
Дисциплинированность Недисциплинированность
Ярко выраженная 5 4 3 2 1 0 1 2 3 4 5 Не ярко выраженная
Оценочные шкалы могут быть изображены графически. В этом случае они выражают категории в наглядной форме. При этом каждое деление (ступень) шкалы характеризуется вербально.
Рассматриваемые методы играют большую роль в анализе и обобщении полученных данных. Они позволяют установить различные соотношения, корреляции между фактами, выявить тенденции в развитии психолого-педагогических явлений. Так, теория группировок математической статистики помогает определить, какие факты из собранного эмпирического материала сопоставимы, по какому основанию их правильно сгруппировать, какой степени достоверности они будут. Все это позволяет избежать произвольных манипуляций с фактами и определить программу их обработки. В зависимости от целей и задач обычно применяют три вида группировок: типологическую, вариационную и аналитическую. Типологическая группировка используется, когда необходимо разбить полученный фактический материал на качественно однородные единицы (распределение количества нарушений дисциплины между различными категориями студентов, разбивка показателей выполнения ими физических упражнений по годам учебы и т.п.).
В случае необходимости сгруппировать материал по величине какого-либо изменяющегося (варьирующего) признака – разбивка групп обучающихся по уровню успеваемости, по процентам выполнения заданий, однотипным нарушениям установленного порядка и т.п. – применяется вариационная группировка, дающая возможность последовательно судить о структуре изучаемого явления.
Аналитический вид группировки помогает устанавливать взаимосвязь между изучаемыми явлениями (зависимость степени подготовки студентов от различных методов обучения, качества выполняемых заданий от темперамента, способностей и т.д.), их взаимозависимость и взаимообусловлен-ность в точном исчислении.
Насколько важна работа исследователя по группировке собранных данных, свидетельствует тот факт, что ошибки в этой работе обесценивают самую исчерпывающую и содержательную информацию.
В настоящее время математические основы группировки, типологии, классификации получили наиболее глубокое развитие в социологии. Современные подходы и методы типологии и классификации в социологических исследованиях могут быть с успехом применены в психологии и педагогике.
В ходе исследования используются приемы итогового обобщения данных. Одним из них является прием составления и изучения таблиц.
При составлении сводки данных относительно одной статистической величины образуется ряд распределения (вариационный ряд) значения этой величины. Примером такого ряда (см. табл. 6.9) может служить сводка данных относительно окружности груди 500 лиц.
Таблица 6.9
Окружность груди в см
|
Число людей
|
76
|
3
|
79
|
19
|
82
|
63
|
85
|
104
|
88
|
138
|
91
|
101
|
94
|
43
|
97
|
22
|
100
|
4
|
103
|
3
|
Итого
|
500
|
Сводка данных одновременно по двум и более статистическим величинам предполагает составление таблицы распределения, раскрывающей распределение значений одной статической величины в соответствии со значениями, которые принимают другие величины.
В качестве иллюстрации приводится таблица 6.10, составленная на основании статистических данных относительно окружности груди и веса этих людей.
Таблица 6.10
Окружность груди в см
|
Вес в кг
|
47
|
51
|
55
|
59
|
63
|
67
|
71
|
75
|
79
|
83
|
Итого
|
76
|
-
|
2
|
1
|
-
|
-
|
-
|
-
|
-
|
-
|
-
|
3
|
79
|
-
|
5
|
9
|
4
|
1
|
-
|
-
|
-
|
-
|
-
|
19
|
82
|
1
|
8
|
16
|
22
|
14
|
1
|
1
|
-
|
-
|
-
|
63
|
85
|
3
|
5
|
20
|
35
|
26
|
9
|
5
|
1
|
-
|
-
|
104
|
88
|
-
|
2
|
7
|
31
|
49
|
35
|
6
|
8
|
-
|
-
|
138
|
91
|
-
|
-
|
3
|
17
|
26
|
29
|
15
|
7
|
3
|
1
|
101
|
94
|
-
|
-
|
-
|
3
|
8
|
14
|
8
|
8
|
2
|
-
|
43
|
97
|
-
|
-
|
-
|
1
|
2
|
6
|
5
|
5
|
2
|
1
|
22
|
100
|
-
|
-
|
-
|
-
|
1
|
-
|
1
|
1
|
-
|
1
|
4
|
103
|
-
|
-
|
-
|
-
|
-
|
-
|
1
|
1
|
1
|
-
|
3
|
Итого
|
4
|
22
|
56
|
113
|
127
|
94
|
42
|
31
|
8
|
3
|
500
|
Таблица распределения дает представление о соотношении и связи, существующих между двумя величинами, а именно: при малом весе частоты располагаются в верхней левой четверти таблицы, что указывает на преобладание лиц с малой окружностью груди. По мере увеличения веса до среднего значения распределение частот передвигается в центр таблички. Это указывает, что люди, вес которых ближе к среднему, имеют окружность груди, также близкую к среднему значению. При дальнейшем увеличении веса частоты начинают занимать правую нижнюю четверть таблички. Это свидетельствует о том, что у человека с весом более среднего окружность груди также выше среднего объема.
Из таблицы следует, что установленная связь не строгая (функциональная), а вероятностная, когда с изменениями значений одной величины другая изменяется как тенденция, без жесткой однозначной зависимости. Подобные связи и зависимости часто встречаются в психологии и педагогике. В настоящее время они выражаются обычно с помощью корреляционного и регрессивного анализа.
Вариационные ряды и таблицы дают представление о статике явления, динамику же могут показать ряды развития, где первая строка содержит последовательные этапы или промежутки времени, а вторая – полученные на этих этапах значения изучаемой статистической величины. Так выявляются возрастание, убывание или периодические изменения изучаемого явления, вскрываются его тенденции, закономерности.
Таблицы могут заполняться абсолютными величинами, или сводными цифрами (средними, относительными). Результаты статистической работы – помимо таблиц часто изображаются графически в виде диаграмм, фигур и т. д. Основными способами графического изображения статистических величин являются: способ точек, способ прямых и способ прямоугольников. Они просты и доступны каждому исследователю. Техника их использования – проведение осей координат, установление масштаба, и выписка обозначения отрезков (точек) на горизонтальных и вертикальной осях.
Диаграммы, изображающие ряды распределения значений одной статистической величины, позволяют составить кривые распределения.
Графическое изображение двух (и более) статистических величин дает возможность образовать некоторую кривую поверхность, называемую поверхностью распределения. Ряд развития при графическом исполнении образуют кривые развития.
Графическое изображение статистического материала позволяет глубже проникнуть в смысл цифровых величин, уловить их взаимозависимости и черты изучаемого явления, которые трудно заметить в таблице. Исследователь освобождается от той работы, которую он вынужден был бы проделать, чтобы разобраться с обилием цифр.
Таблицы и графики – важные, но только первые шаги в исследовании статистических величин. Основным же методом является аналитический, оперирующий математическими формулами, с помощью которых выводятся так называемые “обобщающие показатели”, то есть абсолютные величины, приведенные в сравнимый вид (относительные и средние величины, балансы и индексы). Так, с помощью относительных величин (процентов) определяются качественные особенности анализируемых совокупностей (например, отношение отличников к общему числу студентов; числа ошибок при работе на сложной аппаратуре, вызванных психической неустойчивостью обучающихся, к общему числу ошибок и т.п.). То есть выявляются отношения: части к целому (удельный вес), слагаемых к сумме (структура совокупности), одной части совокупности к другой ее части; характеризующие динамику каких-либо изменений во времени и др.
Как видно, даже самое общее представление о методах статистического исчисления говорит о том, что эти методы располагают большими возможностями в анализе и обработке эмпирического материала. Разумеется, математический аппарат может бесстрастно обработать все, что в него вложит исследователь и достоверные данные, и субъективные домыслы. Вот почему совершенное владение математическим аппаратом обработки накопленного эмпирического материала в единстве с доскональным знанием качественных характеристик исследуемого явления является необходимым для каждого исследователя. Только в этом случае возможен отбор качественного, объективного фактического материала, его квалифицированная обработка и получение достоверных итоговых данных.
Такова краткая характеристика наиболее часто применяемых методов исследования проблем психологии и педагогики. Следует подчеркнуть, что ни один из рассмотренных методов, взятый сам по себе, не может претендовать на универсальность, на полную гарантию объективности получаемых данных. Так, элементы субъективизма в ответах, полученных путем опроса респондентов, очевидны. Результаты наблюдений, как правило, не свободны от субъективных оценок самого исследователя. Данные, взятые из различной документации, требуют одновременно проверки достоверности этой документации (особенно личных документов, документов из “вторых рук” и т.д.).
Поэтому каждому исследователю следует стремиться, с одной стороны, к совершенствованию техники применения любого конкретного метода, а с другой – к комплексному, взаимоконтролирующему использованию разных методов для изучения одной и той же проблемы. Владение всей системой методов дает возможность разработать рациональную методику исследования, четко организовать и провести его, получить существенные теоретические и практические результаты.
|
|
|