Тема работы: основы математической статистики.
Закон распределения случайной величины
Теоретическая справка
Случайной величиной называется числовая переменная величина, принимающая в зависимости от случая те или иные значения с определёнными вероятностями. Число попаданий в цель при данном числе выстрелов, скорость молекулы газа являются типичными примерами случайных величин.
Для задания случайной величины нужно знать множество всевозможных её значений и вероятности, с которыми эта случайная величина принимает свои значения. Все эти данные образуют
закон распределения случайной величины или
распределение вероятности.
Будем называть две случайные величины
x и
y взаимно независимыми, если события
x =
xi и
y =
yj являются взаимно независимыми.
Пример
Пусть в мишень стреляют два стрелка. При этом закон распределения числа выбиваемых на мишени очков для первого стрелка задан таблицей:
Аналогичный закон распределения для второго стрелка задан таблицей:
Найдём закон распределения суммы очков, выбиваемых обоими стрелками.
Составим таблицу – закон распределения случайной величины x + y, где x – количество очков, выбиваемых первым стрелком, а y – количество очков, выбиваемых вторым стрелком.
№
|
x
|
y
|
x + y
|
Вероятность результата
|
1
|
1
|
1
|
2
|
0 ∙ 0,2 = 0
|
2
|
1
|
2
|
3
|
0 ∙ 0,5 = 0
|
3
|
1
|
3
|
4
|
0 ∙ 0,3 = 0
|
4
|
2
|
1
|
3
|
0,2 ∙ 0,2 = 0,04
|
5
|
2
|
2
|
4
|
0,2 ∙ 0,5 = 0,1
|
6
|
2
|
3
|
5
|
0,2 ∙ 0,3 = 0,06
|
7
|
3
|
1
|
4
|
0,8 ∙ 0,2 = 0,16
|
8
|
3
|
2
|
5
|
0,8 ∙ 0,5 = 0,4
|
9
|
3
|
3
|
6
|
0,8 ∙ 0,3 = 0,24
|
|
|
Значит, искомое распределение вероятностей задаётся таблицей
2
|
3
|
4
|
5
|
6
|
0
|
0,04
|
0,1 + 0,16 = 0,26
|
0,06 + 0,4 = 0,46
|
0,24
|
Математическое ожидание Mx случайной величины x равно
Дисперсией случайной величины x называется среднее значение квадрата отклонения случайной величины от её математического ожидания:
Пример Пусть
Х — дискретная случайная величина,
заданная рядом распределения
Задача 1. На пути движения автомашины 4 светофора, каждый из которых запрещает дальнейшее движение автомашины с вероятностью 0,5. Найти ряд распределения числа светофоров, пройденных машиной до первой остановки. Чему равны математическое ожидание и дисперсия этой случайной величины?
Задача 2. В магазине имеется 15 автомобилей определенной марки. Среди них 7 черного цвета, 6 серого и 2 белого. Представители фирмы обратились в магазин с предложением о продаже им 3 автомобилей этой марки, безразлично какого цвета. Составьте ряд распределения числа проданных автомобилей черного цвета при условии, что автомобили отбирались случайно.
Задача 3. В городе 4 коммерческих банка. У каждого риск банкротства в течение года составляет 20%. Составьте ряд распределения числа банков, которые могут обанкротиться в течение следующего года.
Задача 4. Охотник стреляет по дичи до первого попадания, но успевает сделать не более четырех выстрелов. Составить закон распределения числа промахов, если вероятность попадания в цель при одном выстреле равна 0,7. Найти дисперсию этой случайной величины.
Задача 5. В магазине продаются 5 отечественных и 3 импортных телевизора. Составить закон распределения случайной величины – числа импортных из четырех наудачу выбранных телевизоров. Найти функцию распределения этой случайной величины и построить ее график.
Практическая работа № 16
Тема работы: математическая статистика.
Теоретическая справка
Пусть
x1,
x2,...,
xn− выборка объема
n из некоторой генеральной совокупности. По этой выборке можно оценить основные числовые характеристики генеральной совокупности. Различные элементы выборки
xi называются
вариантами. Ряд вариант, расположенных в порядке возрастания их значений называется
вариационным рядом. Им пользуются, в основном, при малых
n . Если
n велико, то ряд преобразуют в группировки по отдельным значениям признака
x (дискретная группировка) или по интервалам изменения признака (интервальная группировка), для чего разбивают диапазон изменения признака
x , называемый размахом
R =
xmax - xmin, на
K равных интервалов. Для определения количества интервалов рекомендуется правило
, где 5 ≤
K ≤ 20. Иногда данные для обработки поступают уже в интервальной группировке, или представляется невозможным использовать одинаковые интервалы (например, в экономике).
Результат группировки представляют рядом вариант или интервалов вариант, расположенных в порядке их возрастания и рядом соответствующих
частот. Под
частотой mi признака или интервала понимают число членов выборки с данной вариантой
xi или, соответственно,
число членов выборки, варианты которых лежат в
i – м интервале.
Относительной частотой hi называется отношение частоты
miк объему выборки:
Таким образом, если проведена группировка, то значению
xiили
i – му интервалу (
i = 1,...,
k ) будут отвечать частоты
miи относительные частоты
при этом
а все выборочные значения, попавшие в
i –ый интервал, заменяют серединой интервала
ui
Пример 1. В обувном магазине за день продали 30 пар мужской обуви следующих размеров:
39, 41, 40, 42, 41, 40, 42, 44, 42, 43, 42, 41, 43, 39, 42, 39, 41, 43, 41, 38, 43, 42, 41, 40, 41, 38, 44, 40, 39, 44.
Решение: Проведем группировку по отдельным значениям признака, то есть по размеру обуви (дискретная группировка):
xi
|
38
|
39
|
40
|
41
|
42
|
43
|
44
|
|
mi
|
2
|
4
|
4
|
7
|
6
|
4
|
3
|
30
|
hi
|
0,067
|
0,133
|
0,133
|
0,233
|
0,2
|
0,133
|
0,1
|
1
|
Итак, пусть
x1,
x2,...,
xn − выборка объема
n из генеральной совокупности, имеющей функцию распределения
F(
x) . Числовые характеристики выборки называются
выборочными (эмпирическими) числовыми характеристиками. Введем основные числовые характеристики:
−
среднее арифметическое (среднее)
Если
сделана дискретная группировка, то
при интервальной группировке
−
выборочная (эмпирическая) дисперсия
При дискретной группировке
при интервальной группировке
−
стандартное (среднее квадратическое) отклонение является корнем из выборочной дисперсии:
−
коэффициент вариации
−
выборочные начальные и центральные моменты порядка l( l=1, 2, 3…), соответственно, определяются формулами
при интервальной группировке
Оценка коэффициента асимметрии S
k (симметричность относительно среднего
) определяется по формуле
Оценка эксцесса E
x (меры островершинности распределения по сравнению с нормальным распределением).
Если E
x>0, то
вершина более острая, а если E
x<0, то более плоская, чем у нормального распределения. У нормального распределения E
x=0
Выборочная мода
Для дискретного вариационного ряда (дискретная группировка) мода определяется как значение варианты с наибольшей частотой, если выборка достаточно большая.
При интервальной группировке выбирается интервал, которому соответствует наибольшая частота. Пусть это k-ый интервал (t
k-1-t
k), частота равна m
k, а ширина d, тогда
Выборочная медиана
. Определяется, как значение признака, относительно которого выборка делится на две равные по объему части. Если выборка объема n представлена вариационным рядом, то
При интервальной группировке (интервальный вариационный ряд) сначала находят так называемый медианный интервал (t
s-1 – t
s), номер s которого определяют из неравенства:
Где
- сумма частот всех интервалов левее медианного,
- сумма частот, включающая частоту медианного интервала.
Пример.
Дана выборка объема n=40 с интервальной группировкой:
Интервалы
|
5-7
|
7-9
|
9-11
|
11-13
|
13-15
|
15-17
|
17-19
|
mi
|
4
|
8
|
11
|
7
|
5
|
3
|
2
|
Найти оценки моды и медианы для этой выборки
Решение
Оценка моды. Ширина интервала равна 2, а наибольшая частота отвечает третьему интервалу и равна m
3=11, поэтому
Оценка медианы.
Определим медианный интервал
Следовательно, третий интервал (9-11) – медианный. Поэтому согласно формуле получаем оценку медианы
Предварительная
проверка на нормальность
С помощью вычисленных числовых характеристик можно определить, является ли выборочное распределение близким к нормальному (или является таковым), то:
В интервалы должны попадать соответственно приблизительно 68%, 95% и 100% выборочных значений
В не слишком маленькой выборке величина коэффициента вариации V должна быть не более 33%, то есть V<0,33.
Оценка эксцесса , и коэффициента асимметрии , должны быть близки к нулю;
Пример
В результате измерения температуры раздела фракции бензин-авиакеросин на установке первичной переработки нефти были получены значения температур, приведенные в таблице (в градусах Цельсия).
По этой выборке вычислены основные числовые характеристики для объема выборки n=50:
Индивидуальные задания
Для каждой из приведенных выборок вычислить основные числовые характеристики. Провести предварительную проверку на нормальность распределения.
1. 11, 15, 12, 0, 16, 19, 6, 11, 12, 13, 16, 8, 9, 14, 5, 11, 3.
2. 3,1; 3,0; 1,5; 1,8; 2,5; 3,1; 2,4; 2,8; 1,3.
Распреление скорости автомобилей на одном из участков шоссе (км/час).
Интервалы
|
61 − 69
|
69 − 77
|
77 − 85
|
85 − 93
|
93 −101
|
Частота
|
5
|
13
|
23
|
7
|
2
|
3. Найти выборочную дисперсию и коэффициент вариации признака по данному распределению.
Интервалы
|
9 – 12
|
12 – 15
|
15 – 18
|
18 – 21
|
21 – 24
|
24 – 27
|
mi
|
6
|
12
|
33
|
22
|
19
|
8
|