Навигация по странице:
|
1. Математическая статистика. Ее виды, особенности, задачи
1. Математическая статистика. Ее виды, особенности, задачи.
Математическая статистика – раздел математики, посвященный математическим методам обработки, систематизации и использования статичных данных для практических и научных целей.
Задачей этого раздела является разработка практических методов, регистрации, описания, анализ экспериментальных данных, получаемых в опытах с массовыми явлениями.
Особенностью статистики является изучение массовых, случайных явлений в условной неопределенности. Достоверность выводов зависит от числа объектов исследования. На основе анализов и прогнозов вырабатывается оптимальное решение.
Статистика подразделяется на:
- теоретическую (вырабатывает методы)
прикладную (общая, отраслевая (экономическая статистика, метеорологическая, медицинская))
Медицинская статистика:
ст. рождаемости
ст. заболеваемости
ст. смертности
ст. медицинских учреждений
Биологическая статистика (=биометрия) – включает статистические методы, используемые в различных биологических исследованиях (в цитологии, микробиологии).
Статистика:
описательная (комплекс методов сбора, группировки данных и представления их в виде таблиц, графиков…)
аналитическая (делает заключения, выводы с целью практического применения)
2. Основные понятия описательной статистики. Их характеристика
-
Генеральная совокупность – подлежащая изучению совокупность однородных элементов, которая характеризуется некоторым признаком. Например, нас интересует распространенность данного заболевания в определенном регионе, тогда генеральная совокупность, это все население региона. Если необходимо выразить мужчин и женщин отдельно по этому заболеванию, то получаем 2 генеральные совокупности.
Количество объектов, входящих в генеральную совокупность называется объемом генеральной совокупности (N)
Генеральная совокупность можно изучать по некоторой ее части.
Выборочная совокупность - часть генеральной совокупности, выбираемая для статистической обработки (выборка) ( объем выборки -n). Свойства объектов выборки должны соответствовать свойствам генеральной совокупности.
Результаты исследования некоторого признака генеральной совокупности, будут более надежны, если выборку образовывать случайным образом. Элементы выборки берутся наугад. Каждый объект может попасть в выборку с одинаковой вероятностью. Главным вопросом является: как определить объем выборки, необходимой для получения необходимого результата.
Варианта – значение признака для каждого элемента выборки (х)
Признаки могут быть качественными и количественными
Количественные делятся на непрерывные (масса тела) и дискретные (количество волос)
Признак, имеющий значение от одного объекта к другому называется варьирующимся. Если количественный признак лежит в интервале – интервальный.
Частота – количество объектов с конкретным числовым значением признака
xi 35 36 37 38 39 40 41
ni (pi): 2 4 5 6 7 7 2
Частность или относительная частота – доля варианта с данным значением признака (ni/n)
3. Ряды распределения и способы их представления.
Ряд распределения – это последовательность качественных или количественных значений признака и частоты его встречаемости.
Ряд, составленного на основе качественного признака – атрибутивных количественного – вариационный.
Рассмотрим подробнее распределение количественного признака. Значение признака, записанное для всех элементов выборки в том порядке, в каком они были получены образуют простой (упорядоченный) статистический ряд.
1 2 3 4 5 6
170 165 171 165 163 174
Из данных видно: некоторые значения вариант повторяются. Для сокращения записи данные располагаются в упорядоченном виде с указанием частот. Такой ряд называется упорядоченным (=ранжированным).
ni 1 2 1 1 1 1
xi 163 165 160 171 174
Вариационные ряды могут быть непрерывными и дискретными
Способы представления рядов:
Табличный (см. выше)
Аналитический (с помощью формул)
Графический (строится на основании табличных данных)
Способы графического представления:
А) диаграмма в отрезках – совокупность вертикальных прямых /отрезков. Способ удобен для представления дискретных признаков при небольшом объеме совокупности.
Б) гистограмма – совокупность прилегающих друг к другу прямоугольников. Способ используется для изображения. для интервального ряда. На оси Х откладываются интервалы значения варианта. На каждом из них (на основании) строят прямоугольник. Его высота зависит от частоты встречаемости данной величины.
В) полигон частот – ломаная линия, соединяющая точки, являющиеся серединами интервалов.
Г) Вариационные кривые в зависимости от значения распределения.
ni
Прямоугольное распределение объема совокупности
ni
Колоколообразное (= унимодальное)
ni
Бимодальное
ni
Экспоненциальное
4. Основные меры положения и рассеяния.
Меры положения частного распределения, их характеристика.
На практике ряды распределения описываются различными числовыми характеристиками (мерами).
Мода (Мо) – это варианта, наиболее часто встречающаяся в совокупности (= модальное значение).
2 Медиана (Ме) – это величина, делящая ранжированный ряд на 2 равные части. Так же она делит площадь под кривой распределения. Для того, чтобы определить Ме надо ранжировать ряд (в порядке возрастания), вычислить номер, под которым стоит медиана.
N/2 – Для четных, (N+1)/2 – Для нечетного количества объектов
3 Средняя арифметическая простая – это частное деление суммы всех
значений признака на их общее число объектов
X=(X1+X2+X3…+Xn)/N
Сумма всех <+> и <�–> отклонений от х равно «0».
Среднюю арифметическую простую вычисляют для неупорядоченных рядов в тех случаях, когда каждая варианта встречается 1 раз.
4 Средняя взвешенная
Если в совокупности отдельные варианты встречаются неоднократно, то вычисляется средняя взвешенная – это величина, полученная суммированием произведений числовых значений вариант на их частоты с последующим делением суммы на количество всех вариант.
=(х1n1+x2n2+x(n)n(n))/N x1n1+y2n2
5 Средняя квадратическая используется, если признаки выражаются мерами площади. Пример: размер колонии микробов, листовых пластинок.
6 Средняя гармоническая, кубическая, геометрическая
Меры рассеяния частного распределения.
Разброс числовых значений вариант (генеральной, выборочной совокупности) относительно средних значений характеризуется мерами рассеяния.
Лимит – минимальная и максимальная варианта совокупности. (Xmin, Xmax)
Вариационный размах – разность между максимальным и минимальным значением R=Xmax-Xmin
Индивидуальное отклонение – разность между числовым значением варианты и средним арифметическим всей совокупности Di=Xi-
Дисперсия – мера рассеяния, полученная суммированием квадратов индивидуальных отклонений и последующим делением суммы на объем совокупности.
- для генеральной
- для выборочной совокупности
Если число объектов менее 30, то рассчитывается исправленная дисперсия (Сигма с крышей)
Где N-1 – число степеней свободы. Это число на 1 меньше, чем весь объем свободности
-
Стандартное (среднее квадратичное) отклонение. Эта мера рассеяния, равная корню квадрата дисперсии, S=корень квадратный из . Чем сильнее варьирует признак, тем больше величина среднего квадратного отклонения.
6. Коэффициент вариации - мера рассеяния равна, отношению стандартного отклонения к средней арифметической V=(S/X)100%
При нормальном распределении коэффициент вариации не > 50%, а часто гораздо ниже (приблизительно 20%)
5. Выборочный метод. Выборки, их виды и требования к ним.
Для того, чтобы получить исчерпывающую информацию о состоянии генеральной совокупности нужно учесть весь ее состав без исключения. Но не всегда есть возможность или необходимость прибегать к сплошному исследованию. В целях экономии времени и средств, анализу подвергается часть совокупности выборки, по ней судят о состоянии всей совокупности в целом.
Если число объектов менее 30, то выборка называется малой. В зависимости от способов формирования, выборки бывают повторные – с возвратом, неповторные – без возврата
Требования к выборкам
А) Рендомизация - каждая варианта генеральной совокупности имеет одинаковую вероятность для попадания в выборку.
Репрезентативность – состав и структура выборки должны соответствовать составу и структуре генеральной совокупности.
|
Генеральная совокупность
|
Выборочная
|
Объем
|
N
|
n
|
Среднее значение
|
M
|
|
Дисперсия
|
|
S в квадрате
|
Стандартное отклонение
|
|
S
|
Ошибки репрезентативности, их особенности.
Возникающие отклонения выборочных показателей от параметров генеральной совокупности называются – ошибками репрезентативности. Параметрами называются характеристики, относящиеся к генеральной совокупности. Характеристики, относящиеся к выборке называются оценками параметров. Ошибки репрезентативности бывают случайными и систематическими, устранимыми и неустранимыим. Устранимая ошибка предотвращается правильной организацией исследования и четким ведение протокола.
Неустранимые ошибки заложены в природе статистических методов. Фактически они являются ошибками репрезентативности. Это своеобразные показатели вариаций выборочных характеристик по отношению к таким же характеристикам генеральной совокупности. Величина ошибки зависит от объема выборки, степени вариации признаков, способа отбора вариант. При увеличении числа вариантов выборки ошибки– 0.
Ошибка (Мх)
Мх=(S)/ корень квадратный из n
Mx=(S)/ корень квадратный из 2n
Mx=(V)/ корень квадратный из 2n
V-коэффициент вариации
Показатель точности оценки параметров.
Чтобы получить определенное представление о точности, с которой определяется тот или иной средний результат, принято использовать показатели точности.
C=(x/)100%; Если известно значение коэффициента вариации, то используется C=V/корень квадратный из n
Точность достаточная, если С = 3-5%
6. Нормальное распределение, его виды, формулы, графики, особенности.
Для того, чтобы оценить закон распределения переменной случайной величины, нужно найти функциональную зависимость между числовыми значениями, которые она может принимать и вероятностью этих значений. В пределах заданного интервала непрерываемая случайная величина может принимать любые числовые значения. Речь идет о значениях, которые она может принимать с определенной вероятностью.
Виды нормального распределения
А) Эмпирическое – получается опытным путем на основе статистического исследования. В этом случае объем совокупности всегда конечен
Б) Теоретическое – абстрактная математическая модель. Ее используют для сравения и оценки опытных распределений по разным статистическим критериям.
В) Стандартное – оно используется в качестве стандарта при оценке любых данных.
Г) Общее – нормальное распределение – оно описывается формулой Гаусса – Лапласа, которая выражает зависимость между вероятностью и нормированным отклонением
y – значение функции – частота встречаемости вариант с данным значением признака
Сигма – стандартное отклонение, t – нормированное отклонение.
Нормированное отклонение определяет отклонение значение варианты от среднего арифметического (N) выраженного в долях от стандартного отклонения
График общего нормального распределения
Его строят в прямой системе координат. По горизонтали – числовые значения признака (возрастание), по вертикали – значение У, соответствует числу данных вариант.
ni
Особенности нормального распределения
1 Кривая симметрична относительно среднего арифметического.
2 Для строго нормального теоретического распределения средняя арифметическая мода и медиана совпадают
3 Положение кривой на горизонтальной оси определяется числовым значением средней арифметической
4 Вытянутость кривой зависит от стандартного отклонения. Чем выше сигма, тем упрощеннее график
Значение площади под кривой зависит от объема совокупности
5 Значение У является наибольшим для средней арифметической.
6 Для каждой точки горизонтальной оси высота кривой определяется значением ординаты У. Чем больше отклоняются числовые значения вариант от среднего арифметического, тем реже такие варианты встречаются в совокупности.
ni
Площадь по кривой соответствует 100% всех наблюдений
|
|
|