Главная страница
Навигация по странице:

Основы теории Стохастических систем (лекции). Основы теории стохастических систем



Скачать 18.19 Mb.
Название Основы теории стохастических систем
Анкор Основы теории Стохастических систем (лекции).doc
Дата 13.04.2017
Размер 18.19 Mb.
Формат файла doc
Имя файла Основы теории Стохастических систем (лекции).doc
Тип Лекция
#910
страница 4 из 10
1   2   3   4   5   6   7   8   9   10

1. Функциональные и корреляционные связи между переменными


Экспериментальные данные представляют собой количественные характеристики каких-либо объектов или процессов. Они формируются под действием множества факторов, не все из которых доступны контролю. Неконтролируемые факторы могут принимать случайные значения из некоторого множества значений и тем самым обуславливать случайность данных, которые они определяют. Стохастическая природа экспериментальных данных обуславливает необходимость применения соответствующих статистических методов для их обработки и анализа.

Статистические распределения характеризуются наличием бо­лее или менее значительной вариации в величине измеренных переменных у от­дельных единиц совокупности. Возникает вопрос о том, какие же причины формируют уровень переменной в данной совокупности и каков конкретный вклад каждой из них. Изуче­ние зависимости вариации переменных от окружающих условий и со­ставляет содержание теории корреляции.

Изучение действительности показывает, что вариация каждо­й переменной находится в тесной связи с вариацией других переменных, характеризующих исследуемую со­вокупность единиц. Вариация уровня производительности труда работников предприятий зависит от степени совершенства приме­няемого оборудования, технологии, организации производства, труда и управления и других самых различных факторов.

При изучении конкретных зависимостей одни переменные вы­ступают в качестве факторов, обусловливающих изменение дру­гих переменных. Переменные этой первой группы бу­дем называть факторными переменными; а переменные, которые являются результатом влияния этих факто­ров, будем называть зависимыми (результативными).

Например, при изучении зависимости между производительностью труда рабочих и энерговооруженностью их труда уровень производительности труда является результативной переменной, а энерговооруженность тру­да рабочих – факторной переменной.

Рассматривая зависимости между переменными, необходимо выделить, прежде всего, две категории зависимости: 1) функцио­нальные и 2) корреляционные.

Функциональные связи характеризуются полным соответ­ствием между изменением факторной переменной и изменением ре­зультативной величины, и каждому значению факторной переменной соответствуют вполне определенные значения результативного переменной. Функциональная зависимость может связывать результативную переменную с одним или несколькими факторными переменными. Так, величина начисленной заработной платы при повременной оплате труда зависит от количества отработанных часов.

В корреляционных связях между изменением факторной и результативной переменными нет полного соответствия, воздействие отдельных факторов проявляется лишь в среднем при массовом на­блюдении фактических данных. Одновременное воздействие на изучаемую переменную большо­го количества самых разнообразных факторов приводит к тому, что одному и тому же значению факторной переменной соответствует целое распределение значений результативной переменной, по­скольку в каждом конкретном случае прочие факторные переменные могут изменять силу и направленность своего воздействия.

При сравнении функциональных и корреляционных зависи­мостей следует иметь в виду, что при наличии функциональной зависимости между переменными можно, зная величину фактор­ной переменной, точно определить величину результативной переменной. При наличии же корреляционной зависимости устанавли­вается лишь тенденция изменения результативной переменной при изменении величины факторной переменной. В отличие от жест­кости функциональной связи корреляционные свя­зи характеризуются множеством причин и следствий и устанав­ливаются лишь их тенденции.

2. Корреляционный анализ

Основная задача корреляционного анализа заключается в выявлении взаимосвязи между случайными переменными путем точечной и интервальной оценки парных (частных) коэффициентов корреляции, вычисления и проверки значимости множественных коэффициентов корреляции и детерминации. Кроме того, с помощью корреляционного анализа решаются следующие задачи:

- отбор факторов, оказывающих наиболее существенное влияние на результативную переменную, на основании измерения степени связи между ними; -

- обнаружение ранее неизвестных причинных связей.

Корреляция непосредственно не выявляет причинных связей между переменными, но устанавливает численное значение этих связей и достоверность суждений об их наличии.

Выборочная ковариация является мерой взаимосвязи между двумя переменными.

Ковариация между двумя переменными рассчитывается следующим образом:

,

где - фактические значения случайных переменных x и y,

. .

ковариация – это статистическая мера взаимодействия двух случайных переменных, таких, например, как доходности двух ценных бумаг. Положительное значение ковариации показывает, что доходности этих ценных бумаг имеют тенденцию изменяться в одну сторону.

Ковариация зависит от единиц, в которых измеряются переменные . Поэтому для измерения силы связи между двумя переменными используется другая статистическая характеристика, называемая коэффициентом корреляции.

При проведении корреляционного анализа вся совокупность данных рассматривается как множество переменных (факторов), каждая из которых содержит n –наблюдений; хik – i-ое наблюдение k-ой переменной. Основными средствами анализа данных являются парные коэффициенты корреляции, частные коэффициенты корреляции и множественные коэффициенты корреляции.

Коэффициент парной корреляции

Для двух переменных теоретический коэффициент корреляции определяется следующим образом:

.

Где - дисперсии случайных переменных , а их ковариация.

Коэффициент парной корреляции является показателем тесноты связи лишь в случае линейной зависимости между переменными и обладает следующими основными свойствами:

1) Коэффициент корреляции принимает значение в интервале (-1,+1), или

|xy| < 1.

2) Коэффициент корреляции не зависит от выбора начала отсчета и единицы измерения, т.е.

 (α1X+β; α2Y+β)=xy,

где α1, α2,  - постоянные величины, причем α1>0, α2>0.

3) Случайные величины Х, Y, можно уменьшать (увеличивать) в α раз, а также вычитать или прибавлять к значениям одно и тоже число β – это не приведет к изменению коэффициента корреляции .

При = ±1 случайные величинысвязаны линейной зависимостью, т.е. .

При = 0 линейная корреляционная связь отсутствует.

В практических расчетах коэффициент корреляции генеральной совокупности обычно не известен. По результатам выборки может быть найдена его точечная оценка – выборочный коэффициент корреляции r, так как выборочная совокупность переменных случайна, то в отличие от параметра , r – случайная величина. Оценкой коэффициента корреляции является выборочный коэффициент парной корреляции:

=, (8.1)

где , - оценки дисперсий величин .

Проверка значимости парного коэффициента корреляции

Для оценки значимости коэффициента корреляции применяет­ся t – критерий Стьюдента. При этом фактическое значение этого критерия еалиияяется по формуле:

(8.2)

Вычисленное по этой формуле значение tнабл сравнивается с критическим значением t-критерия, которое берется из таблицы значений t – Стьюдента с учетом заданного уровня значимости и числа степеней свободы.

Если tнабл > tкр, то полученное значение коэффициента корре­ляции признается значимым (то есть нулевая гипотеза, утвер­ждающая равенство нулю коэффициента корреляции, отвергается). И таким образом делается вывод о том, что между исследуемыми перемен­ными есть тесная статистическая взаимосвязь.

Коэффициенты парной корреляции используются для измерения силы линейных связей различных пар переменных из их множества. Для множества m переменных n наблюдений получают матрицу коэффициентов парной корреляции R.

(8.3)

Одной корреляционной матрицей нельзя полностью описать зависимости между величинами. В связи с этим, в многомерном корреляционном еаллизе рассматривается две задачи:

  1. Определение тесноты связи одной случайной величины с совокупностью остальных (m – 1) величин, включенных в анализ;

  2. Определение тесноты связи между величинами при фиксировании или исключении влияния остальных k величин, при k<(m-2).

Эти задачи решаются с помощью коэффициентов множественной и частной корреляции, соответственно.

Множественный коэффициент корреляции

Решение первой задачи осуществляется с помощью выборочного коэффициента множественной корреляции по формуле

, (8.4)

где - определитель корреляционной матрицы R(8.3);

- алгебраическое дополнение элемента rjj той же матрицыR.

Квадрат коэффициента множественной корреляции принято называть выборочным множественным коэффициентом детерминации, который показывает, какую долю вариации (случайного разброса) исследуемой величины Хj объясняет вариация остальных случайных величин X1, X2 , . . . , Xm.

Коэффициенты множественной корреляции и детерминации являются величинами положительными, принимающими значения в интервале от 0 до 1. При приближении коэффициента R2 к единице можно сделать вывод о тесноте взаимосвязи случайных величин, но не о ее направлении. Коэффициент множественной корреляции может только увеличиваться, если в модель включать дополнительные переменные и не увеличится, если из имеющихся переменных производить исключение.

Проверка значимости коэффициента множественной корреляции осуществляется путем сравнения расчетного значения критерия Фишера:

, (8.5)

с табличным Fтабл. Табличное значение критерия определяется заданным уровнем значимости и степенями свободы и . Коэффициент R2 значимо отличается от нуля, если выполняется неравенство

.

Частный коэффициент корреляции

Если рассматриваемые случайные величины коррелируют друг с другом, то на величине коэффициента парной корреляции частично сказывается влияние других величин. В связи с этим возникает необходимость исследования частной корреляции между величинами при исключении влияния одной или нескольких других случайных величин.

Выборочный частный коэффициент корреляции определяется по формуле:

,

где – алгебраические дополнения к соответствующим элементам матрицы (8.3).

    Частный коэффициент корреляции, так же как и парный коэффициент корреляции изменяется от –1 до +1.

Пример 8.1. Вычисление коэффициентов парной, множественной и частной корреляции.

В табл. 8.1. приведена информация об объёмах продаж и затратах на рекламу одной фирмы, а также индекс потребительских расходов за ряд текущих лет.

Требуется:

  1. Построить диаграмму рассеяния (корреляционное поле) для переменных «объёмы продаж» и «индекс потребительских расходов».

  2. Определить степень влияния индекса потребительских расходов на объёмы продаж (вычислить коэффициент парной корреляции).

  3. Оценить значимость вычисленного коэффициента парной корреляции.

  4. Построить матрицу коэффициентов парной корреляции по трем переменным.

  5. Найти оценку множественного коэффициента корреляции.

  6. Найти оценки коэффициентов частной корреляции.

Решение

1) Вытянутость облака точек на диаграмме рассеяния вдоль наклонной прямой позволяет сделать предположение о том, что существует некоторая объективная тенденция прямой линейной связи между значениями переменных x- индекс потребительских расходов и y- объёмы продаж.

В нашем примере диаграмма рассеяния имеет вид, приведенный на рис. 8.1.
Таблица 8.1

Объем продаж, тыс. руб.-Y

126

137

148

191

274

370

432

445

367

367

321

307

331

345

364

384

Затраты на рекламу – Х1

4

4,8

3,8

8,7

8,2

9,7

14,7

18,7

19,8

10,6

8,6

6,5

12,6

6,5

5,8

5,7

Индекс потребительских расходов, % - X2

100

98,4

101,2

103,5

104,1

107

107,4

108,5

108,3

109,2

110,1

110,7

110,3

111,8

112,3

112,9


2) Промежуточные расчеты при вычислении коэффициента корреляции между переменными x- индекс потребительских расходов и y- объёмы продаж приведены в таблице 8.2.

Средние значения случайных величин Х и Y, которые являются наиболее простыми показателями, характеризующими последовательности и , рассчитаем по формулам, соответственно:

.

Дисперсия характеризуют степень разброса значений () вокруг своего среднего ( , соответственно)



Стандартные ошибки случайных величин Х и Y рассчитаем по формулам, соответственно:




Рис. 8.1. Диаграмма рассеяния (корреляционное поле).

Коэффициент корреляции рассчитаем по формуле (8.1):


Таблица 3.2.



Y

X











1

126

100

-180,813

-7,231

1307,500

52,291

32693,160

2

137

98,4

-169,813

-8,831

1499,657

77,991

28836,285

3

148

101,2

-158,813

-6,031

957,838

36,376

25221,410

4

191

103,5

-115,813

-3,731

432,125

13,922

13412,535

5

274

104,1

-32,813

-3,131

102,744

9,805

1076,660

6

370

107

63,188

-0,231

-14,612

0,053

3992,660

7

432

107,4

125,188

0,169

21,125

0,028

15671,910

8

445

108,5

138,188

1,269

175,325

1,610

19095,785

9

367

108,3

60,188

1,069

64,325

1,142

3622,535

10

367

109,2

60,188

1,969

118,494

3,876

3622,535

11

321

110,1

14,188

2,869

40,700

8,230

201,285

12

307

110,7

0,188

3,469

0,650

12,032

0,035

13

331

110,3

24,188

3,069

74,225

9,417

585,035

14

345

111,8

38,188

4,569

174,469

20,873

1458,285

15

364

112,3

57,188

5,069

289,869

25,692

3270,410

16

384

112,9

77,188

5,669

437,557

32,135

5957,910

сумма

4909

1715,7

0,000

0,000

5681,994

305,474

158718,438

среднее

306,8125

107,23125

















3) Оценим значимость коэффициента корреляции. Для этого рассчитаем значение t – статистики по формуле



Табличное значение критерия Стьюдента равно: tтабл = 0,1; k = n – 2 = 14) =1,76. Сравнивая числовые значения критериев, видно, что tрасч > tтабл, т.е. полученное значение коэффициента корреляции значимо.

Таким образом, индекс потребительских расходов оказывает весьма высокое влияние на объёмы продаж.

4) Матрица R коэффициентов парной корреляции, вычисленных по формуле (8.1) для трех факторов будет иметь вид:







Объем еалиизации

Затраты на рекламу

Индекс потребительских расходов







1

2

3

Объем реализации

1

1

0,646

0,816

Затраты на рекламу

2

0,646

1

0,273

Индекс потребительских расходов

3

0,816

0,273

1

5) Вычисление множественного коэффициента корреляции y c x1 и x2.



- определитель корреляционной матрицы R равен 0,1304.

- алгебраическое дополнение 1-го диагонального элемента той же матрицыR

.

6) Вычисление коэффициентов частной корреляции.



,

где алгебраическое дополнение элемента матрицыR, а алгебраическое дополнение 2-го диагонального элемента :



.

Коэффициенты частной корреляции можно вычислить, используя коэффициенты парной корреляции:


1   2   3   4   5   6   7   8   9   10
написать администратору сайта