Культура
Искусство
Языки
Языкознание
Вычислительная техника
Информатика
Финансы
Экономика
Биология
Сельское хозяйство
Психология
Ветеринария
Медицина
Юриспруденция
Право
Физика
История
Экология
Промышленность
Энергетика
Этика
Связь
Автоматика
Математика
Электротехника
Философия
Религия
Логика
Химия
Социология
Политология
Геология
|
Тема 6.Выборочное наблюдение. Тема Выборочный метод в статистических исследованиях
Тема 6. «Выборочный метод в статистических исследованиях».
Понятие выборочного исследования. Виды выборки.
Способы отбора единиц из генеральной совокупности.
Понятие ошибки выборки
Определение ошибки выборки при разных способах отбора единиц из генеральной совокупности
Определение численности выборки
Малая выборка.
Вопрос 1. Понятие выборочного исследования. Виды выборки.
Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части на основе положений случайного отбора. Подлежащую изучению совокупность, из которой производится отбор части единиц, называют генеральной совокупностью. Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или выборкой. Генеральная совокупность может быть конечной (число наблюдений N = const) или бесконечной (N = ¥), а выборка из генеральной совокупности – это всегда результат ограниченного ряда n наблюдений. Долей выборкиknназывается отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:
kn= n/N.
Значение выборочного метода состоит в том, что при минимальной численности обследуемых единиц проведение исследования осуществляется в более короткие сроки и с минимальными затратами труда и средств. Это повышает оперативность статистической информации, уменьшает ошибки регистрации.
В проведении ряда исследования выборочный метод является единственно возможным, например, при контроле качества продукции (товара, услуги), если проверка сопровождается уничтожением или разложением на составные части обследуемых образцов.
При соблюдении правил научной организации обследования выборочный метод даёт достаточно точные результаты, поэтому его целесообразно применять для проверки данных сплошного учёта. Минимальная численность обследуемых единиц позволяет провести, исследование более тщательно и квалифицированно. Так, при переписи населения практикуются выборочные контрольные обходы для проверки правильности записей сплошного наблюдения.
Таким образом, основными причинами применения выборочного исследования являются:
♦ экономия;
♦ невозможность проведения сплошного исследования.
По сравнению с другими статистическими методами, применяющими не сплошное наблюдение, выборочный метод имеет важную особенность, которая заключается в том, что в основе отбора единиц для обследования положены принципы равных возможностей попадания в выборку каждой единицы генеральной совокупности. Именно в результате соблюдения этих принципов исключается образование выборочной совокупности только за счёт лучших или худших образцов. Это предупреждает появление систематических (тенденциозных) ошибок и делает возможным производить количественную оценку ошибки представительства (репрезентативности).
Проведение исследования социально-экономических явлений выборочным методом складывается из ряда последовательных этапов:
1) обоснование (в соответствии с задачами исследования) целесообразности применения выборочного метода исследования;
2) составление программы проведения статистического исследования выборочным методом;
3) решение организационных вопросов сбора и обработки исходной информации;
4) установление доли выборки, т.е. части подлежащих обследованию единиц генеральной совокупности;
5) обоснование способов формирования выборочной совокупности;
6) осуществление отбора единиц из генеральной совокупности для их обследования;
7) фиксация в отобранных единицах (пробах) изучаемых признаков;
8) статистическая обработка полученной в выборке информации с определением обобщающих характеристик изучаемых признаков;
9) определение количественной оценки ошибки выборки;
10) распространение обобщающих выборочных характеристик на генеральную совокупность.
При выборочном наблюдении дело имеют с двумя категориями обобщающих показателей с относительными и средними величинами.
Относительные величины применяют для сводной характеристики совокупностей по альтернативному признаку; такая характеристика даётся в виде доли (удельного веса) тех единиц совокупности, которые обладают интересующим исследователя признаком. Например, при анализе качества продукции определяют относительную долю тех единиц, которые не выдерживают установленного стандарта качества, т.е. относятся к браку и т.д.
Во всех случаях, когда речь идёт о вариации альтернативных признаков, мы будем иметь дело с обобщающим показателем в виде относительной доли единиц. В генеральной совокупности доля единиц, обладающих изучаемым признаком, называется генеральной долей.
Кроме измерения доли, перед выборочным наблюдением может стоять задача измерения среднего значения варьирующего признака во всей совокупности. В этом случае имеют дело с признаками, вариация которых проявляется в разных количественных значениях у отдельных единиц совокупности.Средняя величина изучаемого варьирующего признака - генеральной средней.
В выборочной совокупности долю изучаемого признака называют выборочной долей, или частью, а среднюю величину в выборке - выборочной средней. Основная задача выборочного исследования в сфере обслуживания состоит в том, чтобы на основе характеристик выборочной совокупности получить достоверные суждения о показателях доли или средней в генеральной совокупности.
Условия проведения выборки
Во-первых, она должна быть достаточно многочисленной, чтобы в ней могли проявиться закономерности, существующие в генеральной совокупности.
Во-вторых, элементы выборки должны быть отобраны объективно, независимо от воли исследователя, чтобы каждый из них имел одинаковые шансы быть отобранным или чтобы эти шансы были известны исследователю.
Пример 1. Имеются данные о зарплате рабочих в у. е.
Группы по з/пл. тыс. руб.
|
ГС - человек
|
Из них попали в выборку
|
10-13
|
100
|
5
|
13-16
|
150
|
10
|
16-19
|
400
|
30
|
19-22
|
200
|
45
|
22-25
|
150
|
10
|
Итого
|
1000
|
100
|
Как видим, зарплату от 100 до 130 в ГС получают 10%, в ВС – 5%. Доля этой группы в ВС ниже, чем в ГС, ВС неточно представляет ГС.
Зарплату от 190 до 220 в ГС получают 20%, а в выборку получающих такую зарплату попало 45%. Снова налицо проблема репрезентативности.
Виды выборки:
По участию единиц наблюдения в отборе:
Повторная выборка, при которой попавшая в выборку единица после регистрации возвращается в генеральную совокупность и таким образом сохраняет равную возможность наряду с другими единицами быть использованной в дальнейшей процедуре отбора; при этом численность единиц генеральной совокупности N остается неизменной.
Бесповторная выборка, при которой попавшая в выборку единица не возвращается в исходную совокупность и в дальнейшем выборе не участвует; при этом численность единиц генеральной совокупности N сокращается в процессе отбора.
По количеству ступеней отбора:
-
Одноступенчатая, при которой каждая отобранная единица сразу подвергается изучению по данному признаку;
Многоступенчатая, при которой производят отбор из генеральной совокупности отдельных групп, из которых выбирают подгруппы и т. д., на последней стадии единица отбора совпадет с единицей наблюдения.
Вопрос 2. Способы отбора единиц из генеральной совокупности.
Существует 5 основных способов отбора единиц из генеральной совокупности в выборочную.
Собственно-случайный отбор состоит в том, что выборочная совокупность образуется в результате случайного отбора n отдельных единиц из генеральной совокупностиN объектов. При этом количество отобранных в выборку единиц обычно определяется исходя из принятой доли выборки. Важным условиям репрезентативности собственно-случайной выборки является то, что каждой единице генеральной совокупности представляется равная возможность попасть в выборку. Формирование собственно-случайной выборки осуществляется с помощью:
фишек (жеребьевки), при этомвсе единицы совокупности нумеруются, номера записываются на карточки, а потом единицы совокупности выбираются в случайном порядке;
таблицы случайных чисел или специальной программы – генератора случайных чисел (как правило, используются на практике).
Собственно-случайный отбор может быть как бесповторным, так и повторным. Собственно случайный отбор даёт лотерея или жеребьёвка. Например, в тираже выигрышей денежно-вещевой лотереи или государственных займов обеспечивают абсолютно равную возможность попадания в тираж (выборку) любого номера билета. Владельцы каждого номера билета имеют равную возможность на выигрыш.
Простой отбор с помощью регулярной процедуры или механическая выборка состоит в том, что отбор единиц в выборочную совокупность производится из генеральной совокупности, разбитой на равные интервалы. Такой отбор осуществляется с применением механической составляющей (номера квартиры, даты, дня недели, буквы алфавита). На практике механическая выборка обычно осуществляется при помощи так называемого шага отбора
1) Все единицы совокупности нумеруются
2) Определяется шаг отбора
При этом размер интервала в генеральной совокупности равен обратной величине доли выборки.
На практике собственно случайный отбор в чистом виде применяется очень редко. Обычно применяют механический отбор единиц выборочной совокупности, который является разновидностью собственно-случайного отбора. При механическом отборе 100 студентов из 1000 поступают так: составляют алфавитный список, в который включают всех студентов, и определяют интервал, равный частному от деления генеральной совокупности на численность выборочной совокупности. Например, интервал равен 10. Величина интервала при механическом отборе равен обратной величине относительного объёма выборки. Например, при 5%-ной выборке интервал равен 20.
Для обеспечения репрезентативности выборки все единицы генеральной совокупности должны располагаться в определенном порядке. По отношению к изучаемому показателю единицы генеральной совокупности могут быть упорядочены по существенному, второстепенному или нейтральному признаку.
При упорядочении по существенному или второстепенному признаку в выборочную совокупность должна отбираться та единица, которая находится в середине каждой группы.
При упорядочении по нейтральному признаку из первой группы генеральной совокупности можно взять любую единицу. Для обеспечения репрезентативности во всех последующих группах механической выборки берут лишь те единицы, которые соответствуют порядковому номеру единицы, отобранной в первой группе. Принцип случайного отбора в механической выборке обеспечивается тем, что единицы генеральной совокупности располагаются в таком порядке, который не оказывает никакого влияния на поведение интересующего исследователя признака.
Механическая выборка является бесповторной. Механический способ отбора удобен к применению и в тех случаях, когда генеральная совокупность формируется постепенно, и заранее список её единиц составить нельзя. Например, при выборочном обследовании покупателей магазина, посетителей поликлиник и т.д. В данных случаях заранее составить списки генеральной совокупности нельзя, так как она формируется постепенно. Но, обследуя, например каждого пятого, или десятого и т.д. посетителя можно организовать механическую выборку, обеспечивая случайность отбора.
3. На практике исследователи чаще всего имеют дело с неоднородными по изучаемым показателям совокупности (например, изучение платёжеспособного спроса населения на услуги сервиса). В этом случае обычно прибегают к предварительному районированию генеральной совокупности, т.е. разбивают на группы (на отдельные типы) по признакам, от которых зависят изучаемые показатели. Внутри этих групп производится механический отбор или собственно-случайный отбор единиц выборочной совокупности. Такой способ отбора называется.
Типическая выборка - отбор в соответствии с принятой схемой (собственно-случайной или механической (последний также носит название типический отбор с механической выборкой или механический отбор с предварительным районированием), который производится из генеральной совокупности, предварительно разделенной на типы (однородные группы).
Способ проведения типической выборки:
1. вся совокупность делится на типические группы
2. из каждой типической группы отбирается некоторое количество единиц
Репрезентативность типической выборки обеспечивается расчленением генеральной совокупности на качественно однородные группы, что обусловливает представительство в выборке каждой типологической группы.
В некоторых источниках типическую выборку называют стратифицированной. Стратифицированныйотбор заключается в том, что генеральная совокупность объема N подразделяется на части совокупности или слои (страты) объема N1, N2, … , Nr, так что N1 + N2 + … + Nr = N. Страты - однородные объекты с точки зрения статистических характеристик (например, население по возрасту делится на две страты – в трудоспособном и нетрудоспособном возрасте; банки – по размеру капитала). В этом случае выборки называются стратифицированными (расслоенными, типическими, районированными).
Типический отбор выгодно применять тогда, когда неравномерно распределяются показатели между группами, иначе говоря, при большой дисперсии групповых средних (межгрупповая вариация). Кроме того, при типическом отборе достигается более полное представление в выборе отдельных типов изучаемого явления. Поэтому можно сказать, что при изучении сложных совокупностей предварительное (выделение групп) является одним из важнейших принципов научной организации выборочного наблюдения.
4. При серийной (гнездовой) выборке из генеральной совокупности отбирают не отдельные единицы, а целые их серии (гнезда). В состав серий или гнёзд входят единицы, связанные определённым образом: например, территориально (селения, районы и др.), организационно (студенческие группы, предприятия и т.д.), упаковкой (продукция, оформляемая в пачки, коробки, ящики, и т.д.) и др. группы. Отбор серий производится посредством собственно-случайной или механической выборки. Внутри каждой из попавших в выборку серий обследуются, как правило, все без исключения единицы, т. е. применятся, как правило, сплошное наблюдение. Серийная (гнездовая) выборка удобна в том случае, если необходимо обследовать сразу "блок" или серию объектов (например, партию товара, продукцию определенной серии или предприятия территориально-административной единицы).
5. Комбинированный отбор предполагает сочетание перечисленных способов (например, стратифицированный и случайный или случайный и механический).
Вопрос 3. Понятие ошибки выборки
Задача выборочного наблюдения - дать верное представление о сводных показателях всей совокупности факторов на основе некоторой их части, подвергнутой обследованию, т.е. определение характеристик генеральной совокупности по выборочным данным. Чаще других при выборочном наблюдении исследуется либо среднее значение того или иного признака у единиц совокупности (например, средняя урожайность, средняя заработная плата и т.д.), либо доля единиц обладающих тем или иным признаком, т.е. удельный вес определённых единиц в совокупности (например, доля орошаемых земель, доля отдельных пород деревьев в лесном массиве и т.д.).
Поскольку речь идёт о варьирующих признаках и изучают не всю совокупность единиц, а только их часть, то можно заранее сказать, что сводные показатели по этим признакам у части единиц совокупности почти никогда не будут абсолютно совпадать со сводными показателями всей статистической совокупности. Выборочные показатели, как правило, не совпадают с соответствующими показателями генеральной совокупности, а несколько отличаются от них в одну или другую сторону, т.е. при выборочном наблюдении всегда могут возникнуть ошибки, которые можно подразделить на ошибки регистрации и ошибки репрезентативности.
Ошибки регистрации при выборочном наблюдении, как и при сплошном, могут возникнуть по разным причинам: и по вине того, кто проводит наблюдение, и по вине отвечающего на те или иные вопросы, и от способа наблюдения. Но если тщательно провести подготовку кадров и продумать организацию проведения наблюдения, то в силу ограниченности выборочной совокупности (по сравнению с генеральной совокупностью) ошибки регистрации можно свести к минимуму или, во всяком случае, уменьшить их по сравнению с ошибками регистрации сплошного наблюдения.
Ошибка репрезентативности (представительства) свойственна лишь выборочному наблюдению и представляет собой величину возможных расхождений между показателями выборочной и генеральной совокупности.
Ошибки репрезентативности в свою очередь могут иметь случайный характер и систематический.
Систематическая ошибка - это ошибка, тенденциозно искажающая величину исследуемого признака в сторону её увеличения или уменьшения. Возникает она главным образом в результате нарушения случайности отбора.
Случайная ошибка - это ошибка, имеющая одинаковую величину вероятности в сторону уменьшения или увеличения изучаемого показателя; это ошибка, появление которой возможно в результате сущности содержания самого выборочного (не сплошного) наблюдения, в силу того, что исследуется часть, а не вся статистическая совокупность.
Определение величины случайных ошибок репрезентативности и является одной из главных задач теории выборочного метода. Их фиксирование позволяет судить о точности выборки, о возможности распространения выборочных характеристик на генеральную совокупность.
Случайные ошибки выборки определяются по формулам, разработанным на основе теории вероятностей и носят вероятностный характер.
Итак, поскольку изучаемая статистическая совокупность состоит из единиц с варьирующими признаками, то состав выборочной совокупности может в той или иной мере отличаться от состава генеральной совокупности.
Объективно возникающее расхождение между характеристиками выборочной и генеральной совокупности называется ошибкой выборки. Она зависит от ряда факторов:
степени вариации изучаемого признака,
численности выборки,
методов отбора единиц из генеральной совокупности в выборочную
принятого уровня достоверности результата исследования.
Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки μ. Эта величина при соблюдении принципа случайного отбора зависит прежде всего от объема выборки n и от степени колеблемости признака: чем больше n и чем меньше вариация признака (следовательно, и значение s2), тем меньше величина средней ошибки выборки m.
В математической статистике, которая лежит в основе всех расчётов показателей выборочных совокупностей, доказывается, что значения средней ошибки выборки определяются по формуле:
где:
- средняя ошибка выборки;
2 генеральная дисперсия;
n - численность единиц выборочной совокупности.
Использование данной формулы предполагает, что известна генеральная дисперсия. Но при проведении выборочных исследований эти показатели, как правило, неизвестны. Применение выборочного метода как раз и предполагает определение характеристик генеральной совокупности.
На практике для определения средней ошибки выборки обычно используются дисперсии выборочной совокупности. Эта замена основана на том, что при соблюдении принципа случайного отбора дисперсия достаточно большого объёма выборки стремиться отобразить дисперсию в генеральной совокупности.
В математической статистике доказано следующее соотношение между дисперсиями в генеральной и выборочной совокупностях:
Из приведённой формулы видно, что дисперсия выборочной совокупности меньше дисперсии в генеральной совокупности на величину определяемую отношением:
Если n достаточно велико, то данное отношение близко к единице.
Например, при n = 100 оно равно 1,01, а при n = 500 оно равно 1,002. Поэтому с определённой долей погрешности формулу расчёта средней ошибки выборки можно представить в следующем виде.
Однако следует иметь в виду, что данная формула применяется для определения средней ошибки выборки лишь при повторном отборе. Поскольку при бесповторном отборе численность генеральной совокупности N в ходе выборки сокращается, то в формулу для расчёта n средней ошибки выборки включают дополнительный множитель. Формула средней ошибки выборки принимает следующий вид:
Для практики выборочных обследований важно, что средняя ошибка выборки применяется для установления предела отклонений характеристик выборки из соответствующих показателей генеральной совокупности. Лишь с определённой степенью вероятности можно утверждать, что эти отклонения не превысят величины t*μ, которая в статистике называется предельной ошибкой выборки. При Р= 0,683 t = 1
Предельная ошибка выборки связана со средней ошибкой выборки μ отношением:
При этом t как коэффициент кратности средней ошибки выборки зависит от вероятности, с которой гарантируется величина предельной ошибки выборки. Обычно в практике экономических исследований применяют следующие значения t: при Р= 0,9545 t = 2, при Р= 0,9973 t = 3
Вопрос 4. Определение ошибки выборки при разных способах отбора единиц из генеральной совокупности
1. Формулы расчета предельной ошибки выборки для собственно-случайного отбора
Метод отбора
Выборка
|
Повторный отбор
|
Бесповторный отбор
|
Для средней
|
|
|
Для доли
|
|
|
• - выборочная дисперсия;
• W - выборочная доля;
• n - объем выборочной совокупности;
• N - объем генеральной совокупности;
• t - число, связанное с вероятностью, которая берется из таблицы интеграла вероятностей закона нормального распределения.
2. Формулы расчета предельной ошибки выборки для механического отбора аналогичны собственно-случайным для бесповторного отбора
Пример 2.
Для определения среднего срока службы изделий было обследовано 250 изделий. При этом средний срок службы был установлен на уровне 41,9 месяца. Среднее квадратическое отклонение равно 6,2 месяцам.
С вероятностью 0,9973 определить, в каких пределах находится средний срок службы всех изделий
Решение:
• Р=0,9973, t=3 (из таблицы интеграла вероятностей закона нормального распределения).
• При этом вероятность делится на 2.
Пример 3.
Определить вероятность того, что предельная ошибка средней службы не превысит 1 месяц.
Решение:
3. Формулы расчета предельной ошибки выборки для серийного отбора
Метод отбора
Выборка
|
Повторный отбор
|
Бесповторный отбор
|
Для средней
|
Для доли
|
Для средней
|
Для доли
|
Серийная (гнездовая)
|
t×
|
t×
|
t×
|
t×
|
r – количество отобранных серий
R – общее число серий
- межсерийная дисперсия
- межсерийная выборочная дисперсия для доли
- доля изучаемого признака в i-той группе
- средняя выборочная доля изучаемого признака
Пример 4:
На предприятии 10 бригад. Изучается производительность труда. Отбираются 2 бригады. Средняя производительность труда 1-й бригады – 4,6 тонны, а 2-й – 3 тонны. С вероятностью 0,9973 определить пределы в кот. будет находиться средняя производительность труда рабочих данного предприятия. t = 3
Решение
ОТВЕТ:
При отборе, пропорциональном объему типических групп, число наблюдений по каждой группе определяется по формуле:
-объем выборки из -й типической группы.
-общий объем выборки.
-объем -й типической группы в генеральной совокупности
-объем генеральной совокупности.
4. Формулы расчета предельной ошибки выборки для типического отбора
Метод отбора
Выборка
|
Повторный отбор
|
Бесповторный отбор
|
Для средней
|
Для доли
|
Для средней
|
Для доли
|
Типическая (при отборе пропорциональном объему групп)
|
|
|
|
|
Задача 5. Определим средний возраст мужчин, вступающих в брак, произведя 5%-ю типическую выборку:
соц. группа
|
число мужчин
|
средний возраст
|
ср. кв. отклонение
|
доля мужчин, вступающих во второй брак.
|
рабочие
служащие
|
60
40
|
24
27
|
5
8
|
0.10
0.20
|
С вероятностью 0,954 определить
пределы, в которых будет находиться средний возраст мужчин, вступающих в брак
долю мужчин, вступающих в брак во второй раз.
Решение. 1) Средний возраст вступления в брак мужчин находится в пределах
Таким образом, с вероятностью 0,954 можно утвердить, что средний возраст мужчин, вступающих в брак, принимает значения 25,2 ± 1,2 года,
или
2) Доля мужчин, вступающих в брак во второй раз, находится в пределах
Таким образом, с вероятностью 0,954 можно утверждать, что доля мужчин, вступающих в брак во второй раз, принимает значения 14% ± 6%, или
Вопрос 5. Определение численности выборочной совокупности:
Основано на формуле предельной ошибки выборки для соответствующего отбора. Путем преобразования получаем:
Методы оценки дисперсии генеральной совокупности:
1. при условии стабильности совокупности на основе результатов прошлых обследований;
2. при условии стабильности совокупности, зная среднее значение:
3. при известном размахе вариации симметричного распределения
4. при известном размахе вариации асимметричного распределения
5. для альтернативного признака, оценив дисперсию как максимально возможную.
Пример 6.
В городе 2000 семей. Предполагается провести выборочное обследование методом случайной бесповторной выборки для нахождения среднего размера семьи. Определить необходимую численность выборки при условии, что с вероятностью 0,954 ошибка выборки не превысит 1 человека при среднем квадратическом отклонении 3 человека.
Исходные данные:
Ответ: необходимо обследовать не менее 36 семей.
Пример 7.
Сколько следует прохронометрировать операций, чтобы с вероятностью 0,9973 можно было бы утверждать, что разность между средней продолжительностью операций в выборочной и генеральной совокупности не превысит 1 секунды, если по результатам предыдущего испытания установлено, что средняя продолжительность операции равна 30 секундам, а среднее квадратическое отклонение равно 7 секундам?
Решение :
Ответ: нужно прохронометрировать не менее 441 операции.
Вопрос 6. Малая выборка
Малая выборка – это выборка размером от 4 до 30 единиц.
Особенности малой выборки:
1. размер выборки (от 4 до 30 ед)
2. Расчет средней ошибки малой выборки, при этом число степеней свободы равно: к = n-1.
следовательно, расчета предельной ошибки малой выборки
3. Специфика определения коэффициента доверия.
При работе с обычной выборкой для определения t используется таблица «Интеграла вероятностей закона нормального распределения». В случае малой выборки необходимо пользоваться таблицей «Распределение Стьюдента». Табличные значения t при задаваемой вероятности Ф (t) для распределения Стьюдента
4. При малой выборке из формул исключается
так как при определении ошибки выборки преимущественно используют формулы повторного отбора.
|
|
|