Навигация по странице:
|
ОМОИ практические. Пояснительная записка. Практические работы предназначен для обучения студентов практической работе на персональных компьютерах в режиме пользователя
Рекомендации к выполнению:
Ниже в качестве образца приведен пример выполнения подобной работы. В таблице приведены числовые характеристики, которые рассчитываются с помощью функций Excel, построены полигон и гистограмма частот.
Таблица 2
Образец выполнения работы
max
|
85,4
|
|
Признаки
(интервалы)
|
Частоты
|
min
|
54,6
|
|
59,4
|
2
|
R
|
30,8
|
|
64,2
|
12
|
k
|
7
|
|
68,9
|
13
|
сред ар
|
69,30
|
|
73,7
|
13
|
медиана
|
68,53
|
|
78,5
|
4
|
мода
|
68
|
|
83,3
|
4
|
дисперсия
|
45,77408
|
|
88,1
|
2
|
ср. кв. откл
|
6,765655
|
|
|
|
эксцесс
|
0,057761
|
|
|
|
ассиметрия
|
0,385736
|
|
|
|
С (цена деления)
|
=R/k
|
|
|
|
Скопировать массив данных из таблицы 1, расположенной в лабораторной работе.
Создать массив интервалов (количество интервалов было вами рассчитано). Первый интервал определяется как сумма минимального элемента выборки и цены деления (C), последний элемент не должен существенно превышать максимального элемента выборки.
Выделить ячейки под массив частот (пометить доступными способами). Этих ячеек должно быть столько же, сколько ячеек отведено под массив интервалов.
Запустить Мастер Функций . (Под двоичным_массивом здесь понимается массив_интервалов). Ввести координаты массива данных (вариант) и массива интервалов.
После указания всех аргументов функции нажать комбинацию: Ctrl+Shift+Enter. После этого функция ЧАСТОТА заполнит весь выделенный массив.
Для построения частот используется функция
Excel ЧАСТОТА (массив_данных; массив_интервалов). Эта функция относится к классу статистических и производит операции над массивами.
Массив_данных — ячейки с данными выборки.
Массив_интервалов — ячейки, содержащие значения интервалов.
Результатом выполнения функции ЧАСТОТА является массив, содержащий частоты вариантов, попадающие в указанные интервалы. На основе этого результирующего массива (в примере — “Частоты”) и строятся гистограммы и полигоны.
Полигон и гистограмма частот строятся по значениям частоты.
При каком значении эксцесса полигон частот наиболее заострен?
Проверка гипотез на основе критерия согласия Пирсона
Цель: освоить алгоритм проверки непараметрических гипотез 2
Критерий Пирсона или χ2 — наиболее часто используемый статистический критерий для проверки гипотезы о законе распределения случайной величины. Во многих практических задачах закон распределения неизвестен и требует определения. Для достоверного выбора того или иного закона формулируется гипотеза, которая требует подтверждения.
По выборочным данным строится полигон частот и рассчитываются параметры распределения. Гипотеза о предполагаемом законе распределения изучаемого признака выдвигается на основе исследования выборки.
Нулевая гипотеза несет информацию о законе распределения выборки. В данном случае Н0: F(x)=F0(x), где F0(x)=Ф(х; 0, 02). Это обозначает, что выборочная совокупность имеет нормальное распределение.
Конкурирующая гипотеза: выборочная совокупность имеет распределение, отличное от нормального.
Критерий Пирсона является алгоритмом, позволяющим сделать вывод о достоверности выдвинутой гипотезы. Последовательность действий для определения критерия χ2 описана ниже.
Построить таблицу частот опытного распределения в выбранных интервалах (см. лаб. работу 1). Если среди опытных частот имеются малочисленные (ni < 5), то объединить их с соседними. Это будет выбор групп.
Определить теоретические частоты при помощи выбранного закона распределения (например, нормального):
Теоретическая частота для i-го интервала (группы) определяется по формуле: , где n — объем выборки; i,i — границы интервала, Ф(t) —стандартная функция нормального распределения (в Excel она встроена и добавляется с помощью мастера функций; из категории статистические надо выбрать НОРМРАСП() и задать ее аргументы).
Определяются границы интервала i,i так. Например, имеется ряд интервалов: 25, 28, 31, 34, ... Для i = 2, i = 25, i = 28. Значение Ф(t) вычисляется, как функция нормального распределения, с n = 0, n = 1, а значение х — вычисляется по формуле: и .
По формуле вычислить величину 2 . Это будет 20.
Определить число степеней свободы можно по формуле k=m-s, где s-число связей (среднее квадратичное отклонение, среднее арифметическое, частоты), а m – число интервалов выборочного распределения.
Воспользовавшись специальной таблицей, по полученным значениям 2 и k, найти вероятность того, что случайная величина, имеющая 2 -распределение, примет какое-либо значение, не меньшее 20: Р(2 20) = .
-
Сформулировать вывод, руководствуясь общим принципом применения критериев согласия: если вероятность больше 0.01, то имеющиеся расхождения между теоретическими и эмпирическими частотами следует считать несущественными, а опытное распределение — согласующимся с теоретическим. В противном случае ( 0.01), указанные расхождения признаются неслучайными, а закон распределения, избранный в качестве предполагаемого теоретического — отвергается.
Задание:
Используя набор данных из лабораторной работы №1, провести оценку по критерию 2. В качестве гипотезы выбрать: «Экспериментальные данные подчиняются закону нормального распределения».
Рассчитать необходимые параметры для выбранной гипотезы.
Построить таблицу для расчета 2. Примерный вид таблицы для анализа (табл. 26.
Рассчитать критерий согласия Пирсона. Для вероятности = 0.05, сделать вывод подтверждении или отрицании гипотезы нормального распределения данных измерений. Воспользоваться функцией Excel — ХИ2ОБР(), которая выдает значения таблицы вероятностей Р для критерия 2 (Пирсона).
Если табличное значение оказалось меньше рассчитанного экспериментальным путем2, то в этом случае нулевая гипотеза принимается, поскольку отклонения экспериментальных частот от теоретических являются несущественными.
Таблица 1
Расчетная таблица
Контрольные вопросы
Объясните, чем отличаются непараметрические методы проверки гипотез от параметрических.
К какому из методов проверки гипотез относится критерий Пирсона?
Что называется теоретической частотой?
Опишите алгоритм проверки гипотезы по критерию χ2.
Как определить число связей и число степеней свободы?
Что такое доверительный интервал и как он определяется?
Какие данные позволяют сделать вывод об истинности или ложности гипотезы при расчетах критерия Пирсона?
8.Что называется генеральной совокупностью?
9.Приведите пример генеральной совокупности, исследуемого признака и варианта.
10.Дайте понятие частоты.
11.Что представляет собой полигон частот? Какую информацию можно получить, исследуя полигон частот?
12.Какие формы распределений существуют и чем они отличаются друг от друга? В чем разница между теоретическими и экспериментальными распределениями?
13.Что называется медианой и как ее определяют?
14.Что такое мода?
15.Как определить дисперсию экспериментального распределения?
16.Что характеризует асимметрия выборки?
17Как рассчитывается эксцесс выборки?
|
|
|