Главная страница
Навигация по странице:

Рабочая тетрадь статистика_v2. Перед началом выполнения семестрового задания по математической статистике студент должен ответить на следующие вопросы



Скачать 0.53 Mb.
Название Перед началом выполнения семестрового задания по математической статистике студент должен ответить на следующие вопросы
Анкор Рабочая тетрадь статистика_v2.doc
Дата 24.04.2017
Размер 0.53 Mb.
Формат файла doc
Имя файла Рабочая тетрадь статистика_v2.doc
Тип Документы
#2560



рабочая тетрадь по

математической статистике

Вариант _________ Группа __________
Фамилия _____________________________

Перед началом выполнения семестрового задания по математической статистике студент должен ответить на следующие вопросы:





  1. Дискретные случайные величины. Закон распределения вероятностей дискретной случайной величины. Числовые характеристики дискретной случайной величины.

  2. Непрерывные случайные величины. Функция распределения, плотность распределения, их взаимосвязь и свойства. Нормальный закон распределения непрерывных случайных величин, правило «трех сигм». Числовые характеристики непрерывных случайных величин.

  3. Генеральная совокупность и выборка. Вариационный ряд. Гистограмма, эмпирическая функция распределения выборки.

  4. Статистическое оценивание параметра распределения по выборке. Точечные оценки и их характеристики: несмещенность, эффективность, состоятельность.

  5. Интервальные оценки. Доверительные интервалы. Интервальное оценивание параметров нормального распределения.

  6. Статистические гипотезы, их виды. Понятие о проверке статистических гипотез. Ошибки 1 – го и 2 – го рода. Мощность критерия. Доверительные области. Критерий согласия Пирсона.

План выполнения семестрового задания:


  1. Построить статистическое распределение выборки.

  2. Вычислить оценки математического ожидания и дисперсии.

  3. Построить гистограмму относительных частот, установить статистический (эмпирический) закон распределения и записать его функцию плотности. С помощью критерия (Пирсона) проверить гипотезу о согласии эмпирического закона распределения случайной величины с нормальным законом распределения (законом Гаусса).

  4. Построить кривую нормального распределения, приняв за параметры кривой найденные оценки математического ожидания и дисперсии (желательно на одном чертеже с гистограммой).

  5. Вычислить доверительный интервал для математического ожидания и дисперсии.

  6. Решить указанную задачу.



  1. Построение статистического распределения выборки.



Данную выборку преобразуем в вариационный (интервальный) ряд. Для этого:

    1. Упорядочим выборку, т.е. запишем все значения случайной величины в возрастающем порядке



    1. Объем выборки составляет

минимальное значение

максимальное значение


    1. Разобьем диапазон изменения случайной величины на интервалы. Число интервалов определяется по следующей полуэмпирической формуле



с округлением до ближайшего целого.


    1. Ширину каждого интервала берем одинаковой и равной

.

Величину выбираем с точностью выборки и округляем в сторону завышения.

,
.
Границы интервалов вычисляем по формуле

, .






=

=



    1. По протоколу выборки подсчитываем частоту интервала - количество элементов , попавших в -тый интервал. Если элемент совпадает с границей интервала, то он относится к предыдущему интервалу.








=

    1. Вычисляем относительные частоты интервалов

.


=

Полученные данные вносим в первые четыре столбца таблицы 1.

  1. Вычисление оценок математического ожидания и дисперсии



Оценки математического ожидания и дисперсии вычисляются по формулам

, , (1)
где — частота варианты в выборке объема .

Если объем выработки велик, то вычисление точечных оценок математического ожидания и дисперсии по формулам (1) громоздко. Для сокращения вычислений элементам выборки, попавшим в –тый интервал, припишем значения равные серединам интервалов

.







Вносим значения в пятый столбец таблицы 1.

Для упрощения дальнейших выкладок варианты заменяем на условные варианты по формуле

,

где называется ложным нулем (новым началом отсчета). Ложный ноль находим по следующему правилу:

Если число интервалов нечетное, то в качестве ложного нуля берем середину среднего интервала, если четное, то середину того интервала, у которого больше частота .

При этом варианте, которая принята в качестве ложного нуля, соответствует условная варианта, равная нулю.







Значения вносим в таблицу 1.
Подсчитаем произведения , результаты внесем в таблицу 1.
Суммируя седьмой столбец таблицы 1, вычислим значение

=
Оценим математическое ожидание по формуле

.


Подсчитаем произведения , результаты внесем в таблицу 1.
Суммируя восьмой столбец таблицы 1, вычислим значение

=
Оценим дисперсию по формуле










.

Оценка занижает дисперсию генеральной совокупности, поэтому введя поправочный коэффициент

получим несмещенную оценку дисперсии
.


Вычислим оценку среднего квадратического отклонения
.
Для сравнения подсчитаем по «правилу ». Так как для случайной величины, имеющей нормальное распределение, почти все рассеивания укладывается на участке , то с помощью «правила » можно ориентировочно определить оценку среднего квадратического отклонения случайной величины. Берем максимальное практически возможное отклонение от среднего значения и делим его на три.




Табл. 1

Статистическое распределение выборки











№ Кл.

Границы классов





1

2

3

4

5

6

7

8

9













































h1=

=


h2=




  1. Построение гистограммы относительных частот



Гистограммой называется ступенчатая фигура, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной , а высоты равны (плотность относительной частоты).

Для построения гистограммы заполним последний столбец таблицы 1. По полученным данным построим гистограмму:



По данным таблицы 1 построим точки с координатами и соединим их плавной пунктирной линией. Эта линия будет аналогом плотности распределения случайной величины и, следовательно, по виду гистограммы можно выдвинуть гипотезу о нормальном распределении (или о распределении, близком к нормальному) случайной величины с плотностью

В дальнейшем эту функцию будем называть теоретической плотностью распределения.

  1. Проверка гипотезы о нормальном распределении случайной величины.


Ввиду ограниченного числа наблюдений статистический закон распределения обычно в какой-то мере отличается от теоретического. Возникает необходимость определить: является ли расхождение между статистическим и теоретическим законами распределения следствием ограниченного числа наблюдений или оно является существенным и связано с тем, что действительное распределение случайной величины не соответствует выдвинутой гипотезе.

Для проверки гипотезы о нормальном распределении рассматриваемой величины заполним таблицу 2. Для этого:
1. Производим новую классификацию выборки: добавляем новые интервалы и к уже имеющимся и объединяем интервалы, для которых в один.

После объединения количество интервалов .
2. Вычисляем теоретические вероятности попадания варианты в каждом интервале по формуле

,

где , функция Лапласа

.






3. Вычисляем частоты интервалов и относительные частоты с учетом объединения интервалов.
, , , ,
,

4. Для проверки гипотезы о нормальном распределении случайной величины в качестве меры расхождения между теоретическим и статистическим распределениями выберем случайную величину (хи-квадрат)

.

Заполнив таблицу 2, вычислим значение критерия (хи-квадрат статистическое).

Случайная величина распределена по закону с параметром , называемым числом степенной свободы.
Число параметров нормального распределения

Число степенной свободы .
Расхождение между статистическим и теоретическим распределениями является не существенным, если величина не превышает критического значения .

При уровне значимости и числу степенной свободы находим критическое значение

.

Так как

,

то выдвинутую гипотезу о том, что случайная величина распределена по нормальному закону, можно с надежностью

считать правдоподобной, не противоречащей опытным данным.

Табл. 2



Границы классов















1

























2


























3


























4





































































































































Σ

1



















Построим график теоретической плотности распределения

.

Для этого возьмем точек с абсциссами из таблицы 1 и вычислим ординаты этих точек. Результат запишем в таблицу 3.



Табл. 3

N














































































































































































Для более точного построения графика вычислим точку максимума

,

и точки перегиба

,

.
Сравним теоретическую и эмпирическую плотности распределения случайной величины:

Табл. 4.

N








































































































Сравнивая значения ординат плотности распределения случайной величины и плотности относительных частот, мы наблюдаем незначительное отклонение этих величин друг от друга, что также свидетельствует о правильности выбора закона распределения.


  1. Вычисление доверительных интервалов для математического ожидания и дисперсии




    1. Так как гипотеза о нормальном распределении случайной величины не противоречит опытным данным, то будем считать (с некоторым риском), что случайная величина распределена нормально, причем математическое ожидание и среднее квадратическое отклонение этого распределения неизвестны.

Доверительный интервал для оценки математического ожидания имеет вид:




По доверительной вероятности и числу степенной свободы

находим (например, В.Е.Гмурман “Руководство к решению задач по теории вероятностей и математической статистике” приложение3)величину
,

а затем точность оценки
.
Итак, получим искомый доверительный интервал, покрывающий неизвестное математическое ожидание с заданной надежностью , т.е. интервал




    1. Доверительный интервал для имеет вид:


,

Для и по таблице (см. в учебниках В.И. Ермаков “Сборник задач по высшей математике для экономистов” приложение 3 стр. 520 или приложение 4 В.Е. Гмурман “Руководство к решению задач по теории вероятностей и математической статистике”) находим

Отсюда


Поясним смысл, который имеет заданная надежность . Из 100 выборок 95 определяют такие доверительные интервалы, в которых параметр (и) действительно заключен, и только в пяти выборках он может выйти за границы доверительного интервала.

  1. Задача



Решение

написать администратору сайта