Перейти на главную Журналы

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 [62] 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98


Рис. 5-10

В результате процессов ограничекхш си!гналов, превышения сигналов пределов диапазона средства измерений, разбраковки сортируемых изделий, действия автоматических регуляторов и т. п. Примеры моделей, когда для описания наблюдаемого распределения могут быть использованы известные законы распределений, но усеченные в определенных пределах, приведены на рис. 5-10. Однако для достоверной идентификации формы таких распределений нужен очень большой объем исходных данных.

5-5. ИСПОЛЬЗОВАНИЕ КРИТЕРИЕВ СОГЛАСИЯ ПРИ ИДЕНТИФИКАЦИИ ФОРМЫ РАСПРЕДЕЛЕНИЯ ЭКСПЕРГШЕНТАЛЬНЫХ ДАННЫХ

*

В качестве способа оценки близости распределения выборки экспериментальных данных к принятой аналитической модели закона распределения обычно рекомендуется использование так называемых критериев согласия. Известен целый ряд критериев согласия, предложенных разными авторами. Для более подробного знакомства с существом таких критериев можно рекомендовать монографию 1101. Для иллюстрации этих методов рассмотрим лишь два из них - критерий Колмогорова - Смирнова и критерий X* Пирсона. С их помощью оценим близость экспериментальных выборок, представленных полигонами на рис. 5-2, 5-6 и 5-7, к полученным для этих распределений в § 5-4 аналитическим моделям п {у!) = 16е~"*/®! - для рис. 5-2 и п (х) = 21е~* - для рис. 5-6.

Использование критерия согласия Пирсона заключается в вычислении величины х** (хи-квадрат):

где Ej - экспериментальные значения частот (п); Mj - значение частот в том же столбце, соответствующее выбранной модели; т. - число столбцов гистограммы. Значения f, Лf и - Mj для различных Xj на рис. 5-2 приведены ниже:

Хц............ -16-8 О -f-8 -fl6

Ej............ 4 14 16 14 4

lAj ........... 4,3 13,7 16 13,7 4,3

Ej~Mj......... -0,3 -f-0,3 0 -r0,3 -0,3



Если бы выбранная модель в центрах всех т столбцов совпадала с экспериментальными данными, то все т разностей Ej - Лl были бы равны нулю, а следовательно, и значение критерия также было бы равно нулю. Таким образом, есть мера суммарного отклонения между моделью и экспериментальным распределением. Эта мера более наглядно работает, если рассматриваются две или более конкурирующие гипотезы. Например, применительно к гистограмме на рис. 5-2 могло быть выдвинуто конкурирующее предположение считать это распределение не экспоненциальным, а треугольным (рис. 5-2, в). Данные для расчета критерия для этого случая приведены ниже-

Xj............ -16 -8 О -Ь8 +16

Ej............ 4 14 16 14 4

М] ........... 4 14 24 14 4

Ef-Mj ......... О О ~8 О О

Здесь разности Ej - Mj во всех столбцах, кроме центрального, равны нулю и можно было бы предположить, что такая аппроксимация распределения более удачна. Однако расчет критерия показывает, что в первом случае = 0,34,3 + 0.3713,7 -}-+ 0,3713,7 + 0,374,3 = 0,15, а во втором случае - f = 824 = = 2,66, т. е. много больше, следовательно, первая аппроксимация лучше второй.

Критерий Пирсона позволяет произвести сравнение двух моделей и в том случае, когда для них используется разное число столбцов. Правда, критерий не инвариантен к числу столбцов и существенно возрастает с увачичением их числа, но для использования его при различномчисле столбцов составлены таблицы квантилей распределения х. входом в которые служит так называемое число степеней свободы v =т - 1 - г, где г - число определяемых по статистике параметров, необходимых для совмещения модели и гистограммы. Чтобы совместить модель с гистограммой, необходимо определить координату центра, а для того чтобы задать ширину модели, соответствующую ширине гистограммы, нужно определить оценку этой ширины, например с. к. о. Таким образом, число г определяемых по выборке параметров, необходимых для совмещения, равно 2. Отсюда число степеней свободы v == m - 1 - г = m - 3.

Часть таблицы квантилей распределения величины х** приведена в табл. 5-6. С помощью этой таблицы от вычисленных значений можно перейти к указанию вероятности Р и уровня значимости = 1 - Р. Так, для модели рис. 5-2, в число столбцов т =5, следовательно, v = т - 3 = 2и нужно пользоваться первой строкой табл. 5-6. Отсюда значение х? = 0,15 соответствует Pi = 0,92 и = 0,08, а значение х1 ~ 2,66 соответствует Р„ = = 0,25 ц 9, = 0,75.

Эти числа означают следующее. При использовании модели 1 вероятность получить Xi меньшим, чем 0,15, равна 0,92, т. е. такие значения встретятся в 92 случаях из 100. Следовательно,



при Р, равной

0,99

0,95

0,25

2 4 6 8 10 12 14 16

0,02 0,30

0,87 1,65 2,56 3,57 4,66 5,81

0,10 0,71 1,63 2,73 3,94 5,23 6,57 7,96

0,21 1,06 2,20 3,49 4,87 6,30 7,79 9,31

0,45 1,65 3,07 4,59 6,18 7,81 9,47 11,2

1,4 3,4 5,4 7,3 9,3 11,3 13,3 15,3

2,77 5,39 7,84 10,2 12,5 14,8 17,1 19,4

отвергая модель 1, мы при многократном повторении будем ошибаться в среднем 92 раза из 100, т. е. оснований для ее отклонения кет. При использовании модели 2 с = 2,66, = 0,25 и = = 0,75, отвергая эту модель, мы будем в среднем ошибаться лишь 25 раз из 100, а в 75 случаях будем правы.

Однако первое утверждение, что «для отклонения модели 1 с Xi =0,15, =0,92 и =0,08 оснований нет», отнюдь не есть утверждение, что данная модель и есть искомое распределение. Дело заключается в том, что, кроме модели экспоненциального распределения с а = 3, мы могли бы использовать модель вида трапеции, модель вида шапо и т. д. И во всех случаях использования подходящих моделей х* получало бы малые значения, а вероятность оказывалась бы достаточно большой (равной, например, 0,9; 0,95 и т. п.). Поэтому при использовании критериев согласия положительный ответ нельзя рассматривать как утверждение о правильно выбранной модели. Определенным ответом является лишь отрицательный ответ.

Таким образом, диалог с критерием согласия следует понимать только следующим образом. Вы спрашиваете: «Не является ли это распределение экспоненциальным с « = 3?» Ответ = 0,15, Р = 0,92 означает: «Тоже может быть». Вы спрашиваете: «А может быть оно трапецеидальным?» Огвет х =0,21, Р =0,9 означает; «Тоже может быть». Вы спрашиваете: «А может быть, оно имеет форму шапо?» Ответ х =0,10, Р =0,95 означает: «Тоже может быть». И эти ответы равнозначны. Определенным является лишь отрицательный ответ. Вы спрашиваете: «А может быть, распределение треугольное?» Ответ х* = 2,66, Р = 0,25, q = 0,75 означает: «Маловероятно, вероятность ошибки q = 0,75».

Подобным же образом с помощью критерия х может быть оценено различие между выбранной выше моделью экспоненциального распределения и гистограмьшми на рис. 5-6 и 5-7. Для гистограммы на рис. 5-6 Ej, Mj и Ej - Mj для различных Xj приведены ниже:




0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 [62] 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98