Навигация по странице:
|
Рабочая тетрадь статистика_v2. Перед началом выполнения семестрового задания по математической статистике студент должен ответить на следующие вопросы
рабочая тетрадь по
математической статистике
Вариант _________ Группа __________
Фамилия _____________________________
Перед началом выполнения семестрового задания по математической статистике студент должен ответить на следующие вопросы:
Дискретные случайные величины. Закон распределения вероятностей дискретной случайной величины. Числовые характеристики дискретной случайной величины.
-
Непрерывные случайные величины. Функция распределения, плотность распределения, их взаимосвязь и свойства. Нормальный закон распределения непрерывных случайных величин, правило «трех сигм». Числовые характеристики непрерывных случайных величин.
Генеральная совокупность и выборка. Вариационный ряд. Гистограмма, эмпирическая функция распределения выборки.
Статистическое оценивание параметра распределения по выборке. Точечные оценки и их характеристики: несмещенность, эффективность, состоятельность.
Интервальные оценки. Доверительные интервалы. Интервальное оценивание параметров нормального распределения.
Статистические гипотезы, их виды. Понятие о проверке статистических гипотез. Ошибки 1 – го и 2 – го рода. Мощность критерия. Доверительные области. Критерий согласия Пирсона.
План выполнения семестрового задания:
Построить статистическое распределение выборки.
Вычислить оценки математического ожидания и дисперсии.
Построить гистограмму относительных частот, установить статистический (эмпирический) закон распределения и записать его функцию плотности. С помощью критерия (Пирсона) проверить гипотезу о согласии эмпирического закона распределения случайной величины с нормальным законом распределения (законом Гаусса).
Построить кривую нормального распределения, приняв за параметры кривой найденные оценки математического ожидания и дисперсии (желательно на одном чертеже с гистограммой).
Вычислить доверительный интервал для математического ожидания и дисперсии.
Решить указанную задачу.
-
Построение статистического распределения выборки.
Данную выборку преобразуем в вариационный (интервальный) ряд. Для этого:
Упорядочим выборку, т.е. запишем все значения случайной величины в возрастающем порядке
Объем выборки составляет 
минимальное значение 
максимальное значение 
Разобьем диапазон изменения случайной величины на интервалы. Число интервалов определяется по следующей полуэмпирической формуле

с округлением до ближайшего целого.

Ширину каждого интервала берем одинаковой и равной
.
Величину выбираем с точностью выборки и округляем в сторону завышения.
,
.
Границы интервалов вычисляем по формуле
, .



=
=
По протоколу выборки подсчитываем частоту интервала - количество элементов , попавших в -тый интервал. Если элемент совпадает с границей интервала, то он относится к предыдущему интервалу.



=
Вычисляем относительные частоты интервалов
.

=
Полученные данные вносим в первые четыре столбца таблицы 1.
-
Оценки математического ожидания и дисперсии вычисляются по формулам
, , (1)
где — частота варианты в выборке объема .
Если объем выработки велик, то вычисление точечных оценок математического ожидания и дисперсии по формулам (1) громоздко. Для сокращения вычислений элементам выборки, попавшим в –тый интервал, припишем значения равные серединам интервалов
.



Вносим значения в пятый столбец таблицы 1.
Для упрощения дальнейших выкладок варианты заменяем на условные варианты по формуле
,
где называется ложным нулем (новым началом отсчета). Ложный ноль находим по следующему правилу:
Если число интервалов нечетное, то в качестве ложного нуля берем середину среднего интервала, если четное, то середину того интервала, у которого больше частота .
При этом варианте, которая принята в качестве ложного нуля, соответствует условная варианта, равная нулю.




Значения вносим в таблицу 1.
Подсчитаем произведения , результаты внесем в таблицу 1.
Суммируя седьмой столбец таблицы 1, вычислим значение
=
Оценим математическое ожидание по формуле
.

Подсчитаем произведения , результаты внесем в таблицу 1.
Суммируя восьмой столбец таблицы 1, вычислим значение
=
Оценим дисперсию по формуле






.
Оценка занижает дисперсию генеральной совокупности, поэтому введя поправочный коэффициент

получим несмещенную оценку дисперсии
.
Вычислим оценку среднего квадратического отклонения
.
Для сравнения подсчитаем по «правилу ». Так как для случайной величины, имеющей нормальное распределение, почти все рассеивания укладывается на участке , то с помощью «правила » можно ориентировочно определить оценку среднего квадратического отклонения случайной величины. Берем максимальное практически возможное отклонение от среднего значения и делим его на три.


 
Табл. 1
Статистическое распределение выборки
|

|

|

|

|

|
№ Кл.
|
Границы классов
|

|

|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
|
|
|
|
|
|
|
|
|
|
∑
|
|
|
|
|
h1=
=
|
h2=
|
|
-
Построение гистограммы относительных частот
Гистограммой называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной , а высоты равны (плотность относительной частоты).
Для построения гистограммы заполним последний столбец таблицы 1. По полученным данным построим гистограмму:

По данным таблицы 1 построим точки с координатами и соединим их плавной пунктирной линией. Эта линия будет аналогом плотности распределения случайной величины и, следовательно, по виду гистограммы можно выдвинуть гипотезу о нормальном распределении (или о распределении, близком к нормальному) случайной величины с плотностью

В дальнейшем эту функцию будем называть теоретической плотностью распределения.
-
Проверка гипотезы о нормальном распределении случайной величины.
Ввиду ограниченного числа наблюдений статистический закон распределения обычно в какой-то мере отличается от теоретического. Возникает необходимость определить: является ли расхождение между статистическим и теоретическим законами распределения следствием ограниченного числа наблюдений или оно является существенным и связано с тем, что действительное распределение случайной величины не соответствует выдвинутой гипотезе.
Для проверки гипотезы о нормальном распределении рассматриваемой величины заполним таблицу 2. Для этого:
1. Производим новую классификацию выборки: добавляем новые интервалы и к уже имеющимся и объединяем интервалы, для которых в один.
После объединения количество интервалов .
2. Вычисляем теоретические вероятности попадания варианты в каждом интервале по формуле
,
где , функция Лапласа
.



3. Вычисляем частоты интервалов и относительные частоты с учетом объединения интервалов.
, , , ,
,
4. Для проверки гипотезы о нормальном распределении случайной величины в качестве меры расхождения между теоретическим и статистическим распределениями выберем случайную величину (хи-квадрат)
 .
Заполнив таблицу 2, вычислим значение критерия (хи-квадрат статистическое).

Случайная величина распределена по закону с параметром , называемым числом степенной свободы.
Число параметров нормального распределения 
Число степенной свободы .
Расхождение между статистическим и теоретическим распределениями является не существенным, если величина не превышает критического значения .
При уровне значимости и числу степенной свободы находим критическое значение
.
Так как
,
то выдвинутую гипотезу о том, что случайная величина распределена по нормальному закону, можно с надежностью

считать правдоподобной, не противоречащей опытным данным.
Табл. 2
№
|
Границы классов
|

|

|

|

|

|

|

|
1
|

|
|
|
|
|
|
|
|
2
|
|
|
|
|
|
|
|
|
3
|
|
|
|
|
|
|
|
|
4
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Σ
|
1
|
|
|
|
|
|


|
Построим график теоретической плотности распределения
.
Для этого возьмем точек с абсциссами из таблицы 1 и вычислим ординаты этих точек. Результат запишем в таблицу 3.


Табл. 3
Для более точного построения графика вычислим точку максимума
,
и точки перегиба
,
.
Сравним теоретическую и эмпирическую плотности распределения случайной величины:
Табл. 4.
Сравнивая значения ординат плотности распределения случайной величины и плотности относительных частот, мы наблюдаем незначительное отклонение этих величин друг от друга, что также свидетельствует о правильности выбора закона распределения.
Вычисление доверительных интервалов для математического ожидания и дисперсии
Так как гипотеза о нормальном распределении случайной величины не противоречит опытным данным, то будем считать (с некоторым риском), что случайная величина распределена нормально, причем математическое ожидание и среднее квадратическое отклонение этого распределения неизвестны.
Доверительный интервал для оценки математического ожидания имеет вид:


По доверительной вероятности и числу степенной свободы

находим (например, В.Е.Гмурман “Руководство к решению задач по теории вероятностей и математической статистике” приложение3)величину
,
а затем точность оценки
.
Итак, получим искомый доверительный интервал, покрывающий неизвестное математическое ожидание с заданной надежностью , т.е. интервал


Доверительный интервал для имеет вид:
,

Для и по таблице (см. в учебниках В.И. Ермаков “Сборник задач по высшей математике для экономистов” приложение 3 стр. 520 или приложение 4 В.Е. Гмурман “Руководство к решению задач по теории вероятностей и математической статистике”) находим

Отсюда


Поясним смысл, который имеет заданная надежность . Из 100 выборок 95 определяют такие доверительные интервалы, в которых параметр ( и ) действительно заключен, и только в пяти выборках он может выйти за границы доверительного интервала.
-
Задача
Решение
|
|
|