Навигация по странице:
|
Взвешенные и структурные средние
Взвешенные и структурные средние
Средняя величина представляет собой обобщенную количественную характеристику признака в статистической совокупности. Средние величины исчисляются для характеристики уровня цен, заработной платы, основного капитала, численности населения и др. однородной совокупности социально-экономических явлений.
Требования, предъявляемые к средним величинам:
- средняя должна характеризовать качественно однородную совокупность;
- средние должны исчисляться по данным большого числа единиц, составляющих совокупность, то есть отображать массовые социально-экономические явления.
Средняя величина всегда именованная, она имеет ту же размерность, что и признак у единиц совокупности (т.е всегда единицы измерения средней такие же, как у единиц наблюдения, для которых вычисляется средняя).
В исследованиях применяются две категории средних: степенные средние и структурные средние.
К степенным средним относятся: средняя арифметическая, средняя гармоническая, средняя геометрическая и средняя квадратическая. Средняя обозначается через . Черта вверху символизирует процесс осреднения индивидуальных значений. Частота – повторяемость отдельных значений признака – обозначается буквой f.
-
Средние для дискретного ряда
Средняя арифметическая взвешенная
Если объем совокупности данных большой и представляет собой ряд распределения, то исчисляется взвешенная среднеарифметическая величина. Она используется, когда варианты исследуемой совокупности встречаются неодинаковое количество раз.
Формула средней арифметической взвешенной:
Пример 1.Найти среднюю заработную плату рабочих цеха за месяц
Заработная плата одного рабочего тыс.руб; X
|
Число рабочих F
|
3,2
|
20
|
3,3
|
35
|
3,4
|
14
|
4,0
|
6
|
Итого:
|
75
|
Средняя заработная плата может быть получена путем деления общей суммы заработной платы на общее число рабочих:
Ответ: 3,35 тыс.руб.
Средняя гармоническая взвешенная
Средняя гармоническая — используется в тех случаях, когда известны индивидуальные значения признака и произведение , а частоты неизвестны.
Формула средней гармонической взвешенной:
Пример 2. Вычислить среднюю урожайность по трем фермерским хозяйствам
В примере ниже (урожайность одного гектара земли) - известна, — площадь неизвестна (хотя её можно вычислить делением валового сбора зерновых на урожайность), — валовый сбор зерна известен.
Фермерское
хозяйство
|
Урожайность
ц/га (х)
|
Валовый сбор зерновых
Ц (z = x*f)
|
1
|
18,2
|
3640
|
2
|
20,4
|
3060
|
3
|
23,5
|
2350
|
Итого
|
|
9050
|
Ответ: 20,1 ц/га
Средняя геометрическая взвешенная
Для определения средней геометрической взвешенной применяется формула:
, , ,
Где – первый уровень (первое значение) ряда динамики,
- второй уровень (второе значение) ряда динамики,
– третий уровень (третье значение) ряда динамики,
- предпоследний уровень ряда динамики,
– последний уровень ряда динамики,
– частоты цепных индексов x1, x2, x3…
Средняя квадратическая взвешенная
Средняя квадратическая взвешенная равна:
-
Средние для интервального ряда
Для вычисления средней в интервальных рядах нужно перейти к дискретному ряду, то есть заменить интервал его средним значением и дальнейшие вычисления производить по формулам для дискретного ряда.
Среднее значение интервала (середина интервала) определяется как среднее арифметическое между верхней и нижней границами интервала:
,
Например, средняя арифметическая для интервального ряда
При расчете средней арифметической для интервального вариационного ряда сначала определяют среднюю для каждого интервала, как полусумму верхней и нижней границ, а затем — среднюю всего ряда. В случае открытых интервалов значение нижнего или верхнего интервала определяется по величине интервалов, примыкающих к ним.
Пример 3. Определить средний возраст студентов вечернего отделения.
Возраст в годах
|
Число студентов
|
Среднее значение интервала
|
Произведение середины интервала (возраст)
на число студентов
|
до 20
|
65
|
(18 + 20) / 2 =19
18 в данном случае граница нижнего интервала. Вычисляется как 20 — (22-20)
|
1235
|
20 — 22
|
125
|
(20 + 22) / 2 = 21
|
2625
|
22 — 26
|
190
|
(22 + 26) / 2 = 24
|
4560
|
26 — 30
|
80
|
(26 + 30) / 2 = 28
|
2240
|
30 и более
|
40
|
(30 + 34) / 2 = 32
|
1280
|
Итого
|
500
|
|
11940
|
Средние, вычисляемые из интервальных рядов являются приближенными.
-
Структурные средние величины
Кроме степенных средних в статистике для относительной характеристики величины варьирующего признака и характеристики рядов распределения пользуются структурными средними: модой и медианой.
Мода
Мода — это наиболее часто встречающийся вариант ряда. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей.
Модой для дискретного ряда является варианта, обладающая наибольшей частотой.
При вычислении моды для интервального вариационного ряда необходимо:
сначала определить модальный интервал (по максимальной частоте),
затем — значение модальной величины признака по формуле:
где:
— значение моды
— нижняя граница модального интервала
i — величина интервала
— частота модального интервала
-
— частота интервала, предшествующего модальному
— частота интервала, следующего за модальным
Определение моды графически: Мода определяется по гистограмме распределения. Для этого
правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника , а левую вершину модального прямоугольника - с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.
Медиана
Медиана — это значение признака, который делит вариационный ряд на две равные по численности части.
Медиана для дискретного ряда.
Для определения медианы в дискретном ряду с нечетным количеством единиц наблюдения сначала порядковый номер медианы по формуле: , а затем определяют, какое значение варианта обладает накопленной частотой, равной номеру медианы.
Если ряд содержит четное число элементов, то медиана будет равна средней из двух значений признака, находящихся в середине. Номер первого из этих признаков определяется по формуле: , для второго - . = n (количество элементов в ряду).
Медиана для интервального ряда
При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана.
Для этого:
определяется номер медианы по формуле: , полученное значение округляется до целого большего числа.
затем по накопленной частоте определяется интервал, в который входит элемент с таким номером,
затем — значение медианы по формуле:
где:
— искомая медиана
— нижняя граница интервала, который содержит медиану
-
i — ширина интервала
— сумма частот или число членов ряда
- накопленная частота интервала, предшествующего медианному
— частота медианного интервала
Пример. Найти моду и медиану для интервального ряда.
Возрастные группы
|
Число студентов
|
Сумма накопленных частот ΣS
|
До 20 лет
|
346
|
346
|
20 — 25
|
872
|
1218
|
25 — 30
|
1054
|
2272
|
30 — 35
|
781
|
3053
|
35 — 40
|
212
|
3265
|
40 — 45
|
121
|
3386
|
45 лет и более
|
76
|
3462
|
Итого
|
3462
|
|
Решение:
Определим моду
В данном примере модальный интервал находится в пределах возрастной группы 25-30 лет, так как на этот интервал приходится наибольшая частота (1054).
Рассчитаем величину моды:
Это значит, что модальный возраст студентов равен 27 годам.
Определим медиану.
Медианный интервал находится в возрастной группе 25-30 лет, так как в пределах этого интервала расположена варианта, которая делит совокупность на две равные части (Σfi/2 = 3462/2 = 1731). Далее подставляем в формулу необходимые числовые данные и получаем значение медианы:
Это значит, что одна половина студентов имеет возраст до 27,4 года, а другая свыше 27,4 года.
Графически медиана определяется по кумуляте. Для ее определения высоту наибольшей ординаты, которая соответствует сумме всех частот, делят пополам. Через полученную точку
проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой.
-
Квантили
Квантили - величины, разделяющие совокупность на определенной количество равных по численности элементов частей.
Самый известный квантиль – медиана, делящая совокупность на две равные части. Кроме медианы часто используются квартили, делящие ранжированный ряд на 4 равные части, децили -10 частей и перцентили — на 100 частей.
Квартили
Квартилипредставляют собой значение признака, делящее ранжированную совокупность на четыре равные по количеству элементов части. Различают квартиль первого порядка (нижний квартиль) и квартиль третьего порядка (верхний квартиль). Первый (нижний) квартиль отсекает от совокупности ¼ часть единиц с минимальными значениями, а третий (верхний) отсекает ¼ часть единиц с максимальными значениями, второй квартиль является медианой. Для расчёта квартили надо поделить вариационный ряд медианой на две равные части, а затем в каждой из них найти медиану.
К примеру, если выборка состоит из 6 элементов, тогда за начальную квартиль выборки принимается второй элемент, а за нижнюю квартиль пятый элемент.
-
|
1 квартиль
|
|
|
2 квартиль
|
|
медиана
В случае, если вариационный ряд состоит к примеру, из 9 элементов, тогда за верхнюю квартиль принимают арифм. среднее 2-го и 3-го элеметов, а за нижнюю арифм. среднее 7-го и 8-го элементов.
-
1 квартиль 3 квартиль
Расчет квартилей для дискретного ряда:
Пример . Расчет медианы и квартилей.
Фирма по продаже сувениров желает узнать рабочую выработку. В данном списке представлено количество сувениров, сделанных каждым рабочим за какой-то день:
92, 100, 89, 98, 101, 84, 113, 93, 81, 14, 113, 86, 98, 99, 105, 88, 101, 89, 93, 102, 101, 99, 87, 109, 92, 99, 111, 98, 102, 95
В вариационном ряду 30 значений: 14, 81 84, 86, 87, 88, 89, 89, 92, 92, 93, 93, 95, 98, 98, ↓, 98, 99, 99, 99, 100, 101, 101, 101, 102, 102, 105, 109, 111, 113, 113.
Найдём верхнюю и нижнюю квартили. Медиана делит вариационный ряд на 15 значений (условное значение обозначено стрелкой). Верняя квартиль – 8-е значение, нижняя - 23-е значение. Q1 = 89, Q2= 101 (шт)
Расчет квартилей для дискретного ряда:
В дискретном ряду сначала определяют номера (позиции) квартилей:
позиция 1-го квартиля
позиция 3-го квартиля
2. Если номер квартиля – целое число, то значение квартиля будет равно величине элемента ряда, которое обладает накопленной частотой равной номеру квартиля. Например, если квартиль находится в 20-й позиции, его значение будет равно значению 20-го наблюдения.
Если номер квартиля – нецелое число, то квартиль попадает между двумя наблюдениями. Значением квартиля будет сумма значения элемента, для которого накопленная частота равна целому значению номера квартиля, и указанной части (нецелая часть номера квартиля) разности между этим наблюдением и следующим. Например, если позиция квартиля равна 20,25, квартиль попадает между 20-м и 21-м наблюдениями, и его значение будет равно значению 20-го наблюдения плюс 1/4 разности между значением 20-го и 21-го наблюдений.
Расчет квартилей для интервального ряда:
Для расчета квартилей для интервального ряда
Определяем номер квартиля,
Определяем квартильный интервал,
Рассчитываем квартиль по формуле:
Где:
- нижняя граница интервала, содержащего нижний квартиль. Интервал определяется по сумме накопленных частот, не превышающей 25 % от суммы всех частот,
- нижняя граница интервала, содержащего верхний квартиль. Интервал определяется по сумме накопленных частот, превышающей 75 % от суммы всех частот.
- ширина интервала
- накопленные частоты интервала, предшествующего интервалу, содержащему нижний квартиль
- накопленные частоты интервала, предшествующего интервалу, содержащему верхний квартиль
- частота интервала, содержащего нижний квартиль
- частота интервала, содержащего верхний квартиль
Децили
Децили – варианты, делящие ранжированный ряд на десять равных частей. Первый дециль отсекает 1/10 часть совокупности, а девятый дециль отсекает 9/10 частей. Таким образом, различают 9 децилей.
Рассчитываются децили по аналогичным формулам:
Определяем номер дециля по формуле:
Если номер дециля – целое число, то значение дециля будет равно величине элемента ряда, которое обладает накопленной частотой равной номеру дециля. Например, если дециль находится в 20-й позиции, его значение будет равно значению 20-го наблюдения.
Если номер дециля – нецелое число, то дециль попадает между двумя наблюдениями. Значением дециля будет сумма значения элемента, для которого накопленная частота равна целому значению номера дециля, и указанной части (нецелая часть номера дециля) разности между этим наблюдением и следующим. Например, если позиция дециля равна 20,25, дециль попадает между 20-м и 21-м наблюдениями, и его значение будет равно значению 20-го наблюдения плюс 1/4 разности между значением 20-го и 21-го наблюдений.
Для интервального ряда:
– значение j-го дециля, - нижняя граница децильного интервала; - ширина децильного интервала; – сумма всех частот, -накопленная частота интервала, предшествующего децильному; - частота децильного интервала.
Перцентили
Перцентили - варианты, делящие ряд на 100 равных частей. Различают 99 децилей.
Определяем номер перцентиля по формуле:
-
Если номер перцентиля – целое число, то значение перцентиля будет равно величине элемента ряда, которое обладает накопленной частотой равной номеру перцентиля. Например, если перцентиль находится в 20-й позиции, его значение будет равно значению 20-го наблюдения.
Если номер перцентиля – нецелое число, то перцентиль попадает между двумя наблюдениями. Значением перцентиля будет сумма значения элемента, для которого накопленная частота равна целому значению номера перцентиля, и указанной части (нецелая часть номера перцентиля) разности между этим наблюдением и следующим. Например, если позиция перцентиля равна 20,25, перцентиль попадает между 20-м и 21-м наблюдениями, и его значение будет равно значению 20-го наблюдения плюс 1/4 разности между значением 20-го и 21-го наблюдений.
Для интервального ряда:
– значение j-го перцентиля, - нижняя граница интервала, содержащего перцентиль; - ширина интервала, содержащего перцентиль; – сумма всех частот, -накопленная частота интервала, предшествующего интервалу, содержащему перцентиль; - частота интервала, содержащего перцентиль.
Расчет квартилей, децилей и перцентилей чаще всего применяется для интервальных рядов, т.к. в этой форме удобно представлять большой объем данных.
|
|
|