Задание 1 – Построение линейной парной регрессии
Текст задания и исходные данные. В лаборатории неразрушающего контроля авиапредприятия проведены испытания новой модификации дефектоскопа путем сравнения регистрируемой и фактической длин трещин по сварным швам. Результаты наблюдений представлены в таблице 2.1 и на рисунке 2.1.
По этим наблюдениям необходимо сформировать линейную модель парной (однофакторной) регрессии, которую предполагается использовать в эксплуатирующих организациях в качестве поправочного графика к модифицированному дефектоскопу.
Таблица 2.1 – Исходные данные для линейной однофакторной модели
Наблюдениеi
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
Прибор , мм
|
9,8
|
11,3
|
11,5
|
11,3
|
10,9
|
11,4
|
12,6
|
12,2
|
Фактически , мм
|
10,2
|
10,1
|
10,1
|
9,2
|
10,7
|
9,0
|
10,4
|
11,1
|
y, мм
12,0
11,0
10,0
9,0
9,0
10,0
11,0
12,0
x, мм
Рисунок 2.1 – Исходные данные для линейной однофакторной модели
Выполнение задания.
Парная регрессия в виде линейной функции имеет общий вид
. (2.1)
Расчет значений коэффициентов a иb в этом уравнении выполняется по формулам
(2.2)
(2.3)
где n – число измерений функции и аргумента;
- значение аргумента, зафиксированное в i-ом измерении;
– значение функции, зафиксированное в i-ом измерении;
– среднее значение аргумента по всем измерениям, рассчитывается по формуле
;
- среднее значение функции по всем измерениям, рассчитывается по формуле
.
Для облегчения вычислений оформим и заполним расчетную таблицу 2.2, содержащую необходимые компоненты зависимостей (2.2) и (2.3)
Таблица 2.2 – Дополненные исходные данные для линейной модели
№ строки
|
i
|
|
|
|
|
|
1
|
1
|
10,2
|
9,8
|
104,0
|
99,9
|
11,40
|
2
|
2
|
10,1
|
11,3
|
102,0
|
114,1
|
11,38
|
3
|
3
|
10,1
|
11,5
|
102,0
|
116,2
|
11,38
|
4
|
4
|
9,2
|
11,3
|
84,6
|
103,9
|
11,17
|
5
|
5
|
10,7
|
10,9
|
114,5
|
116,6
|
11,51
|
6
|
6
|
9,0
|
11,4
|
81,0
|
102,6
|
11,13
|
7
|
7
|
10,4
|
12,6
|
108,2
|
131,1
|
11,44
|
8
|
8
|
11,1
|
12,2
|
123,2
|
135,4
|
11,60
|
9
|
Суммы
|
80,8
|
91,0
|
819,7
|
919,8
|
|
10
|
Средние
|
10,1
|
11,4
|
102,5
|
115,0
|
Используя строки 9 и 10 таблицы 2.2, рассчитаем значения коэффициентов a и b
;
Подставив найденные значения в (2.1) получим искомое уравнение парной линейной регрессии
. (2.4)
Для исходных значений аргумента по (2.4) рассчитаем модельные значения функции . Результаты представим в правом столбце таблицы 2.2 (выделены шрифтом bold) и на рисунке 2.2.
y, мм
12,0
11,0
10,0
9,0
9,0
10,0
11,0
12,0
x, мм
Модель
y = 8,67 + 0,28·x
Рисунок 2.2 – Аппроксимация наблюдений линейной моделью
Выводы:
1
2
3
Задание 2 – Анализ данных на выбросы
Текст задания и исходные данные.
В авиакомпании в интересах управления ежемесячно фиксируются трудозатраты Qi на внеплановую составляющую технического обслуживания самолетов. В результате наблюдений зафиксированы следующие трудозатраты: Qi (чел.·ч) = 140, 145, 144, 137, 135, 138, 141, 143, 146, 144, (i = 1,...,10).
По мере выполнения последующих наблюдений каждое новое значение должно быть проверено на выброс. Новое значение включается в предшествующую выборку только в случае если оно не является выбросом. Считать, что последовательно регистрировались следующие новые значения: Q11 = 147; Q12 = 151; Q13 = 178 чел.·ч.
Анализ данных на выброс выполнять по критерию Диксона rd. Для определения критических значений критерия Диксона rα использовать таблицу 1.9 (при уровне значимости α = 0,05).
Выполнение задания.
Оценим 11-ое значение. Для этого рассчитаем фактическое значение критерия Диксона и сравним его с критическим значением
.
Критическое (табличное) значения критерия . Так как rα > rn, то гипотеза об аномальном характере последнего члена вариационного ряда Q11 = 147 отвергается, т.е. данное значение не является выбросом и в полной мере может дополнить результаты предшествующих наблюдений.
Аналогично оценим 12-ое значение
.
Табличное значение . Так как и в этом случае rα > rn, то гипотеза об аномальном характере последнего члена вариационного ряда Q12 = 151 отвергается.
Оценим 13-ое значение
.
Табличное значение . Так как в этом случае rα < rn, то гипотеза об аномальном характере последнего члена вариационного ряда Q13 = 178 принимается. То есть без дополнительной проверки корректности 13-ое значение не может быть включено в ряд наблюдений.
Выводы:
1
2
3
Задание 3 – Элиминирование результатов наблюдений
Текст задания и исходные данные.
При ежемесячных наблюдениях за надежностью парка вертолетов отмечены следующие значения среднего налета на отказ: Ti (минут) = 125, 137, 145, 142, 96, 135, 111, 102, 113, 103, 91, 84, 90 (i = 1,...,13).
По этим данным предполагается сформировать прогнозную модель. Однако есть основания считать, что отдельные наблюдения недостаточно корректны. В связи с этим перед использованием данных необходимо выполнить их элиминирование (некоторое усреднение).
Элиминирование выполнять с помощью алгоритма «нелинейного элиминирования по семи точкам».
Выполнение задания.
Расчет сглаженного первого значения ряда выполняется по формуле
мин.
Расчет сглаженного второго значения ряда выполняется по формуле
мин.
Расчет сглаженного третьего значения ряда выполняется по формуле
мин.
Расчет последующих 4-го, 5-го, 6-го, 7-го, 8-го, 9-го и 10-го сглаженных значений выполняется по одинаковой формуле
мин.;
мин.;
мин.;
мин.;
мин.;
мин.;
мин.
Расчет сглаженного третьего с конца значения ряда выполняется по формуле
мин.
Расчет сглаженного предпоследнего значения ряда выполняется по формуле
мин.
Расчет сглаженного последнего значения ряда выполняется по формуле
мин.
Исходный и элиминированный ряды данных представлены в таблице 2.16, а в графическом виде – на рисунке 2.7.
Таблица 2.16 - Исходный и элиминированный ряды данных
Ti, мин.
|
125,0
|
137,0
|
145,0
|
142,0
|
96,0
|
135,0
|
111,0
|
102,0
|
113,0
|
103,0
|
91,0
|
84,0
|
90,0
|
T*i, мин.
|
121,9
|
140,3
|
140,8
|
132,6
|
123,7
|
114,4
|
111,2
|
114,2
|
104,2
|
100,1
|
106,5
|
87,3
|
88,2
|
Из полученных результатов следует, что элиминированные данные приближены к средним значениям и, тем самым, в меньшей степени отражают действие случайных факторов, сопутствующих наблюдениям. При последующем формировании прогнозной модели это позволит сформировать более корректную прогнозную модель.
T, минуты
110
100
90
80
70
1
5
7
Месяцы
9
3
11
120
130
140
Результаты
наблюдений
Элиминированные данные
Рисунок 2.7 – Исходный и элиминированный ряды данных
Выводы:
1
2
3
Задание 4 – Анализ данных на стационарность
Текст задания и исходные данные.
В авиакомпании регулярно проводятся организационно-технические мероприятия, направленные на повышение эксплуатационной надежности авиадвигателей. В этой связи организованы наблюдения и помесячный учет средней наработки на отказ. Результаты наблюдений представлены следующим рядом: Ti (ч) = 141,0; 146,5; 172,0; 142,0; 177,5; 138,5; 136,5; 138,0; 140,5; 143,5; 144,0; 145,5; 154,5; 165,0; 166,0; 170,0; 179,5; 143,0; 178,0; 179,0 (i = 1,...,20).
Требуется, используя критерии стационарности (серий, поворотных точек), оценить действенность проводимых профилактических мероприятий. При выявлении позитивного тренда (позитивной не стационарности) проводимые в авиакомпании мероприятия могут быть признаны эффективными.
Анализ выполнить с уровнем значимости α = 0,05.
Выполнение задания.
Задание выполняем в три этапа (по числу используемых критериев).
Анализ по критерию серий. В этом случае по исходному ряду наработок формируем бинарный ряд, состоящий из «1» и «0», который и подлежит последующему анализу. Элементы бинарного ряда формируются по правилу:
(2.37)
где Tм – выборочная медиана исследуемого ряда.
Для определения медианы сортируем значения исходного ряда в порядке не убывания: 136,5; 138,0; 138,5; 140,5; 141,0; 142,0; 143,0; 143,5; 144,0; 145,5; 146,5; 154,5; 165,0; 166,0; 170,0; 172,0; 177,5; 178,0; 179,0; 179,5.
Так как число значений в этом ряде четно (n = 20), то медиана (средина ряда) определяется по формуле
ч.
Тогда по правилу (2.37) сформируем на базе исходного (не ранжированного!) ряда бинарный ряд. Получим «01101000000011111011».
Подсчитаем число непрерывных серий (однородных непрерывных последовательностей из цифр) в этом ряде. Оно составило = 8.
Для заданного уровня значимости α = 0,05 и n = 20 по таблице 1.12 определяем критические значения критериев и
Так как условие стационарности по критерию серий
не выполнено, то анализируемый ряд наработок имеет выраженный тренд.
Анализ по критерию поворотных точек. Данный алгоритм также исследует бинарный ряд из 1 и 0, но образованный по правилу
(2.38)
Последовательно, скользящим образом, от начала исходного ряда к его концу, рассматривая пары смежных значений, построим по правилу (2.38) бинарный ряд из 19-ти значений. Получим «0010110000000000101».
По этому ряду подсчитаем число серий и длину наиболее протяженной серии. Эти статистики оказались равными: ;
Проверяем соответствие значений статистик ν и τ стационарному ряду по следующим двум условиям:
; (2.39)
. (2.40)
Примечание. Критическое значение принято равным 5 (исходя из правила (1.38)).
Так как условие стационарности одновременно по обеим статистикам ν и τ не выполнено, то анализируемый ряд наработок имеет выраженный тренд.
Выводы:
1
2
3
Задание 5 – Подбор экспоненциального распределения
Текст задания и исходные данные.
В ходе тренажей по аэродромному контролю средств наземного обслуживания в 70 наблюдениях были зафиксированы следующие результаты времени контроля одного ТЗ-22 (минут) – в упорядоченном по не убыванию виде: 2,5; 3,0; 4,0; 4,5; 4,5; 5,0; 5,5; 6,0; 6,0; 6,5; 6,5; 7,0; 7,5; 8,0; 8,5; 8,5; 8,5; 9,0; 9,0; 9,0; 9,0; 9,5; 10,0; 10,0; 10,5; 10,5; 11,0; 11,0; 11,5; 11,5; 11,5; 11,5; 12,0; 12,0; 12,0; 12,0; 12,0; 12,0; 12,0; 12,5; 13,0; 13,0; 13,0; 13,0; 13,0; 13,0; 13,0; 13,5; 13,5; 14,0; 14,5; 14,5; 14,5; 14,5; 15,0; 15,0; 15,0; 15,0; 15,0; 15,5; 16,0; 16,0; 17,0; 17,0; 17,5; 17,5; 18,0; 19,0; 20,0 ().
При уровне значимости α = 0,05 по критерию Пирсона необходимо проверить принадлежность наблюдений к экспоненциальному распределению. Инструменты подобранного распределения в последующем предполагается использовать в расчетах по оптимизации парка топливозаправщиков.
Выполнение задания.
Вначале выполним разбиение наблюдений на интервалы равной протяженности. Оценка протяженности единичного интервала и числа интервалов k по рекомендованным формулам (1.3) нецелесообразна по причине получения большого числа интервалов (k = 15) малой протяженности ( 1,5 минуты), что увеличивает объем последующих вычислений. В этой связи, исходя из удобства расчетов, устанавливаем: = 3 минуты; k = 6.
В сгруппированном виде наблюдения представлены в таблице 2.19.
Таблица 2.19 – Группировка наблюдений по интервалам
-
Номер интервалов i
|
Границы интервалов
|
Средины интервалов
|
Фактические частоты
|
1
|
[2…5]
|
3,5
|
6
|
2
|
(5…8]
|
6,5
|
8
|
3
|
(8…11]
|
9,5
|
15
|
4
|
(11…14]
|
12,5
|
22
|
5
|
(14…17]
|
15,5
|
14
|
6
|
(17…20]
|
18,5
|
5
|
Примечание. В таблице 2.19 круглая скобка означает исключение, а квадратная - включение значений, совпадающих с границей.
По исходному ряду рассчитаем среднее и СКО наблюдений
мин.;
мин.
Определим значение параметра экспоненциального распределения по формуле
.
Далее вычисляем теоретические частоты попадания в каждый интервал . Для этого по вначале определяем вероятность попадания вплоть до правой границы интервала, а затем, - вероятность попадания до левой границы интервала. Разность этих вероятностей, умноженная на общее число наблюдений, и будет являться искомой теоретической частотой попадания в рассматриваемый интервал.
При экспоненциальном распределении вероятность определяется уравнением
. (2.52)
С учетом (2.52) рассчитаем теоретические частоты попадания в интервалы:
;
;
;
;
;
.
Рассчитаем фактическое значение критерия Пирсона по формуле
(2.53)
где: – фактическая частота попаданий значений в i-ый интервал;
k= 6 - число единичных интервалов;
- теоретическая частота попаданий значений в i-ый интервал.
Исходя из (2.53) получим
.
Рассчитаем число степеней свободы r = k – s = 6 – 1 = 5, где: k – число интервалов; s – число параметров описывающих рассматриваемое распределение. Экспоненциальное распределение описывает один параметр .
Для r = 6 и доверительной вероятности P = 0,95 по таблице 1.4 определяем табличное (критическое) значение критерия Пирсона .
Так как , то предположение об экспоненциальном законе распределения результатов наблюдений отклоняется.
Для наглядности на рисунке 2.9 показаны гистограмма фактических и график экспоненциального распределения частот попадания наблюдений времени в интервалы.
t, мин.
25
20
15
10
5
0
5
10
15
20
Частоты ni
Экспоненциальное распределение
Рисунок 2.9 – Фактическое и экспоненциальное распределение частот
Выводы:
1
2
3
|