Главная страница
Навигация по странице:

1. Математическая статистика. Ее виды, особенности, задачи



Скачать 432.5 Kb.
Название 1. Математическая статистика. Ее виды, особенности, задачи
Анкор Statistika_1.doc
Дата 05.05.2017
Размер 432.5 Kb.
Формат файла doc
Имя файла Statistika_1.doc
Тип Документы
#7717

1. Математическая статистика. Ее виды, особенности, задачи.

Математическая статистика – раздел математики, посвященный математическим методам обработки, систематизации и использования статичных данных для практических и научных целей.

Задачей этого раздела является разработка практических методов, регистрации, описания, анализ экспериментальных данных, получаемых в опытах с массовыми явлениями.

Особенностью статистики является изучение массовых, случайных явлений в условной неопределенности. Достоверность выводов зависит от числа объектов исследования. На основе анализов и прогнозов вырабатывается оптимальное решение.

Статистика подразделяется на:

- теоретическую (вырабатывает методы)

прикладную (общая, отраслевая (экономическая статистика, метеорологическая, медицинская))
Медицинская статистика:

  • ст. рождаемости

  • ст. заболеваемости

  • ст. смертности

  • ст. медицинских учреждений


Биологическая статистика (=биометрия) – включает статистические методы, используемые в различных биологических исследованиях (в цитологии, микробиологии).
Статистика:

  • описательная (комплекс методов сбора, группировки данных и представления их в виде таблиц, графиков…)

  • аналитическая (делает заключения, выводы с целью практического применения)



2. Основные понятия описательной статистики. Их характеристика





  1. Генеральная совокупность – подлежащая изучению совокупность однородных элементов, которая характеризуется некоторым признаком. Например, нас интересует распространенность данного заболевания в определенном регионе, тогда генеральная совокупность, это все население региона. Если необходимо выразить мужчин и женщин отдельно по этому заболеванию, то получаем 2 генеральные совокупности.

Количество объектов, входящих в генеральную совокупность называется объемом генеральной совокупности (N)

Генеральная совокупность можно изучать по некоторой ее части.


  1. Выборочная совокупность - часть генеральной совокупности, выбираемая для статистической обработки (выборка) ( объем выборки -n). Свойства объектов выборки должны соответствовать свойствам генеральной совокупности.

Результаты исследования некоторого признака генеральной совокупности, будут более надежны, если выборку образовывать случайным образом. Элементы выборки берутся наугад. Каждый объект может попасть в выборку с одинаковой вероятностью. Главным вопросом является: как определить объем выборки, необходимой для получения необходимого результата.


  1. Варианта – значение признака для каждого элемента выборки (х)

Признаки могут быть качественными и количественными

Количественные делятся на непрерывные (масса тела) и дискретные (количество волос)
Признак, имеющий значение от одного объекта к другому называется варьирующимся. Если количественный признак лежит в интервале – интервальный.


  1. Частота – количество объектов с конкретным числовым значением признака

xi 35 36 37 38 39 40 41

ni (pi): 2 4 5 6 7 7 2


  1. Частность или относительная частота – доля варианта с данным значением признака (ni/n)


3. Ряды распределения и способы их представления.
Ряд распределения – это последовательность качественных или количественных значений признака и частоты его встречаемости.

Ряд, составленного на основе качественного признака – атрибутивных количественного – вариационный.

Рассмотрим подробнее распределение количественного признака. Значение признака, записанное для всех элементов выборки в том порядке, в каком они были получены образуют простой (упорядоченный) статистический ряд.
1 2 3 4 5 6

170 165 171 165 163 174
Из данных видно: некоторые значения вариант повторяются. Для сокращения записи данные располагаются в упорядоченном виде с указанием частот. Такой ряд называется упорядоченным (=ранжированным).

ni 1 2 1 1 1 1

xi 163 165 160 171 174

Вариационные ряды могут быть непрерывными и дискретными

Способы представления рядов:

  1. Табличный (см. выше)

  2. Аналитический (с помощью формул)

  3. Графический (строится на основании табличных данных)


Способы графического представления:

А) диаграмма в отрезках – совокупность вертикальных прямых /отрезков. Способ удобен для представления дискретных признаков при небольшом объеме совокупности.


Б) гистограмма – совокупность прилегающих друг к другу прямоугольников. Способ используется для изображения. для интервального ряда. На оси Х откладываются интервалы значения варианта. На каждом из них (на основании) строят прямоугольник. Его высота зависит от частоты встречаемости данной величины.



В) полигон частот – ломаная линия, соединяющая точки, являющиеся серединами интервалов.

Г) Вариационные кривые в зависимости от значения распределения.

ni

Прямоугольное распределение объема совокупности

ni

Колоколообразное (= унимодальное)

ni

Бимодальное

ni

Экспоненциальное

4. Основные меры положения и рассеяния.


Меры положения частного распределения, их характеристика.


На практике ряды распределения описываются различными числовыми характеристиками (мерами).


  1. Мода (Мо) – это варианта, наиболее часто встречающаяся в совокупности (= модальное значение).


2 Медиана (Ме) – это величина, делящая ранжированный ряд на 2 равные части. Так же она делит площадь под кривой распределения. Для того, чтобы определить Ме надо ранжировать ряд (в порядке возрастания), вычислить номер, под которым стоит медиана.

N/2 – Для четных, (N+1)/2 – Для нечетного количества объектов
3 Средняя арифметическая простая – это частное деление суммы всех

значений признака на их общее число объектов

X=(X1+X2+X3…+Xn)/N

Сумма всех <+> и <�–> отклонений от х равно «0».
Среднюю арифметическую простую вычисляют для неупорядоченных рядов в тех случаях, когда каждая варианта встречается 1 раз.

4 Средняя взвешенная

Если в совокупности отдельные варианты встречаются неоднократно, то вычисляется средняя взвешенная – это величина, полученная суммированием произведений числовых значений вариант на их частоты с последующим делением суммы на количество всех вариант.
=(х1n1+x2n2+x(n)n(n))/N x1n1+y2n2

5 Средняя квадратическая используется, если признаки выражаются мерами площади. Пример: размер колонии микробов, листовых пластинок.

6 Средняя гармоническая, кубическая, геометрическая



Меры рассеяния частного распределения.



Разброс числовых значений вариант (генеральной, выборочной совокупности) относительно средних значений характеризуется мерами рассеяния.

  1. Лимит – минимальная и максимальная варианта совокупности. (Xmin, Xmax)

  2. Вариационный размах – разность между максимальным и минимальным значением R=Xmax-Xmin

  3. Индивидуальное отклонение – разность между числовым значением варианты и средним арифметическим всей совокупности Di=Xi-

  4. Дисперсия – мера рассеяния, полученная суммированием квадратов индивидуальных отклонений и последующим делением суммы на объем совокупности.


- для генеральной

- для выборочной совокупности
Если число объектов менее 30, то рассчитывается исправленная дисперсия (Сигма с крышей)



Где N-1 – число степеней свободы. Это число на 1 меньше, чем весь объем свободности


  1. Стандартное (среднее квадратичное) отклонение. Эта мера рассеяния, равная корню квадрата дисперсии, S=корень квадратный из . Чем сильнее варьирует признак, тем больше величина среднего квадратного отклонения.


6. Коэффициент вариации - мера рассеяния равна, отношению стандартного отклонения к средней арифметической V=(S/X)100%

При нормальном распределении коэффициент вариации не > 50%, а часто гораздо ниже (приблизительно 20%)
5. Выборочный метод. Выборки, их виды и требования к ним.
Для того, чтобы получить исчерпывающую информацию о состоянии генеральной совокупности нужно учесть весь ее состав без исключения. Но не всегда есть возможность или необходимость прибегать к сплошному исследованию. В целях экономии времени и средств, анализу подвергается часть совокупности выборки, по ней судят о состоянии всей совокупности в целом.

Если число объектов менее 30, то выборка называется малой. В зависимости от способов формирования, выборки бывают повторные – с возвратом, неповторные – без возврата
Требования к выборкам

А) Рендомизация - каждая варианта генеральной совокупности имеет одинаковую вероятность для попадания в выборку.

Репрезентативность – состав и структура выборки должны соответствовать составу и структуре генеральной совокупности.




Генеральная совокупность

Выборочная

Объем

N

n

Среднее значение

M



Дисперсия



S в квадрате

Стандартное отклонение



S



Ошибки репрезентативности, их особенности.



Возникающие отклонения выборочных показателей от параметров генеральной совокупности называются – ошибками репрезентативности. Параметрами называются характеристики, относящиеся к генеральной совокупности. Характеристики, относящиеся к выборке называются оценками параметров. Ошибки репрезентативности бывают случайными и систематическими, устранимыми и неустранимыим. Устранимая ошибка предотвращается правильной организацией исследования и четким ведение протокола.

Неустранимые ошибки заложены в природе статистических методов. Фактически они являются ошибками репрезентативности. Это своеобразные показатели вариаций выборочных характеристик по отношению к таким же характеристикам генеральной совокупности. Величина ошибки зависит от объема выборки, степени вариации признаков, способа отбора вариант. При увеличении числа вариантов выборки ошибки– 0.

Ошибка (Мх)
Мх=(S)/ корень квадратный из n

Mx=(S)/ корень квадратный из 2n

Mx=(V)/ корень квадратный из 2n

V-коэффициент вариации
Показатель точности оценки параметров.
Чтобы получить определенное представление о точности, с которой определяется тот или иной средний результат, принято использовать показатели точности.

C=(x/)100%; Если известно значение коэффициента вариации, то используется C=V/корень квадратный из n

Точность достаточная, если С = 3-5%

6. Нормальное распределение, его виды, формулы, графики, особенности.


Для того, чтобы оценить закон распределения переменной случайной величины, нужно найти функциональную зависимость между числовыми значениями, которые она может принимать и вероятностью этих значений. В пределах заданного интервала непрерываемая случайная величина может принимать любые числовые значения. Речь идет о значениях, которые она может принимать с определенной вероятностью.
Виды нормального распределения

А) Эмпирическое – получается опытным путем на основе статистического исследования. В этом случае объем совокупности всегда конечен

Б) Теоретическое – абстрактная математическая модель. Ее используют для сравения и оценки опытных распределений по разным статистическим критериям.

В) Стандартное – оно используется в качестве стандарта при оценке любых данных.

Г) Общее – нормальное распределение – оно описывается формулой Гаусса – Лапласа, которая выражает зависимость между вероятностью и нормированным отклонением



y – значение функции – частота встречаемости вариант с данным значением признака



Сигма – стандартное отклонение, t – нормированное отклонение.
Нормированное отклонение определяет отклонение значение варианты от среднего арифметического (N) выраженного в долях от стандартного отклонения
График общего нормального распределения

Его строят в прямой системе координат. По горизонтали – числовые значения признака (возрастание), по вертикали – значение У, соответствует числу данных вариант.

ni



Особенности нормального распределения

1 Кривая симметрична относительно среднего арифметического.

2 Для строго нормального теоретического распределения средняя арифметическая мода и медиана совпадают

3 Положение кривой на горизонтальной оси определяется числовым значением средней арифметической

4 Вытянутость кривой зависит от стандартного отклонения. Чем выше сигма, тем упрощеннее график

Значение площади под кривой зависит от объема совокупности

5 Значение У является наибольшим для средней арифметической.

6 Для каждой точки горизонтальной оси высота кривой определяется значением ординаты У. Чем больше отклоняются числовые значения вариант от среднего арифметического, тем реже такие варианты встречаются в совокупности.
ni



Площадь по кривой соответствует 100% всех наблюдений
написать администратору сайта