![]() |
|
|
Перейти на главную Журналы X)........... . -22 -10 +2 +М +26 Е,............ 3 7 21 7 3 ЛЬ........... 2.37 7 21 7 2.37 Ei-Mj......... 0,63 О О О 0,63 Тогда ЭС = 2 (0,63)72,37 0,3, Pj, 0,85 в уровень вна-чимости 9 = 1 - Jpj, = 0,15, а для гистограммы на рис. 5-7 значения Ej, Mj, Ej - Mj для различных Xj приведены ниже! Xi............ -22 -10 +2 +14 +26 Ej............ 3 8 19 8 3 Mi........... 2,3? 7 21 7 2,37 Ej-Mj......... 0.63 1,0 -2.0 1.0 0,63 Отсюда Хг ~ 1.0, jPj 6= 0,65 и - 1 - i= 0,35. По уровню значимости совпадение первой гистограммы с принятой кодельйэ в qjqx ~ 0,35/0,15 iW 2 раза лучше, чем второй. Однако эти оценки критерия вероятности Р и уровня значимости q отнюдь не могут рассматриваться как показатели достоверности установления вида генеральной совокупности, из которой были получены эти выборки. Так, например, если бы при выборе вида модели для рис. 5-2 не было произведено окр5ггления показателя степени а да 3, а было принято его значение в виде а = 3,3754, то все Ej - Mj для рис. 5-2 были бы близки к нулю и % было бы также близко к нулю, но это отнюдь не означало бы, что искомый вид распределения генеральной совокупности был бы определен нами с вероятностью 0,9999... Критерий согласия Колмогорова - Смирнова [101 позволяв!; сравнить две независимые выборки и ответить на вопрос, относятся ли они к одной к той же генеральной совокупности беь выбора для сравнения какой-либо предполагаемой модели. Критерий Колмогорова (1933 г.) и Смирнова (1939 г.) чувствителен к различию центров, величин рассеяния, аси-мметрии и эксдесса. В качестве статистики служит наибольшая (по модулю) разность между ординатами кривых обеих относительных накопленных частот. Сравнение может выполняться без построения гистограммы, так как интегральные функции распределений в виде набегающих сумм могут быть построены без какого-либо группирования. Если же используются гистограммы, то они должны быть построены при одинаковых для обеих выборок границах и числе интервалов группирования. Накопленные частоты F], и 2 делятся на соответствующие объемы выборок щ и щ. Затем вычисляется разность FJni - iPVa- Максимум модуля этой разности и есть искомая статистика (для двустороннего критерия)! D = шах i Рг/Щ - Fzlth I Распределение статистики было табулировано Смирновыми (1948 г.). Для щ + Яа > 35 граничное значение D с вероятностью Р может быть приближенно найдено из аппроксимирующего выражения где /Сгр - постоянная, зависягцая от назначенной вероятности Р или уровня значимости q = I - Р. Наблюдаемое наибольшее значение разности D значимо на соответствуюгцем уровне q, если оно достигает или превосходит Ор. Для постоянной Кгр Л. Закс [10, с. 302] дает аппроксимацию в виде Кгр V-0Mn(q/2). При сопоставлении данной выборки с объемом п -щ с выбранной аналитической моделью следует полагать тц - оо. Тогда из выражения (5-18) следует Drp = Kjyii = V~ 0,5 In (<7/2)/n» a D находится как D = max i fl - /ft = max (A/n), где A s=: JFe-Fm\- Отсюда искомая вероятность может быть найдена как P2ё-= 2ё-\ (5-19) Таким образом, достоинство критерия Колмогорова - Смирнова состоит в том, что при я > 35 он позволяет чисто аналитически по «приближенной формуле (5-19) оценить вероятность ошибки 9 = 1 - Р, не прибегая к использованию каких-либо таблиц, что резко ускоряет анализ и позволяет использовать ЭВМ. Но допускаемая при этом приближенность должна полностью пониматься пользователем. При большом различии принятой модели и сравниваемой с ней выборки оценка вероятности, получаемая по критерию Колмогорова - Смирнова, достаточно близка к оценке вероятности по критерию Так, например, при сопоставлении гистограммы, показанной на рис. 5-2, в, и модели треугольного распределения по критерию было получено Р = 0,25. Максимальная разность А = - Рм I в этом случае равна 8, и при п = 52 по формуле (5-19) получаем Р = 26"" = 2е"--»-/ = 0,17. Но если бы А было равно 7, 6, 5 и т. д., то рассчитанные по формуле (5-19) при п = 52 вероятности Р составили бы5 А......... 8 7 6 5 4 3 2 1 Р......... 0,17 0,30 0,50 0,76 1,08 1,4 1.7 1,9 Т. е. различие вероятностей 0,17 и 0,25 соответствует изменению А менее чем на одну точку, так как при А = 7 вероятность Р = = 0,30. Однако при А-< 4 рассчитанные вероятности получаются больше единицы и должны считаться равными единице. Это будет происходить при всех А < У 0,5п In 2, когда критерий Колмогорова - Смирнова дает ответ: «Тоже может быть», т. е. уже не отвергает предположений о пригодности модели. Так будет при А < 9 и я = 233, при А < 6 и га = 104, при А < 5 и п = 72, при А < 4 и ft - 46. Поэтому использование критерия Колмогорова - Смирнова применительно к гистограммам на рис. 5-6 и 5-7, где А=8 - 7 = 1 и А=21 - 19 = 2, бессмысленно, (гак как согласно ему предложенная модель совпадает с обеими исследуемыми гистограммами с вероятностью Р = 1. Поэтому в работах по использованию критериев согласия обычно оговаривается, что их применение корректно лишь при достаточно представительных выборках исходных данных и в качестве приближенной ориентировки указывается п > 200. Располагая формулой (5-11), это предупреждение можно раскрыть более наглядно. Действительно, в приведенных примерах для расчета критерия согласия использовалось очень малое число наблюдаемых разностей между гистограммой и моделью А =Ej - Mj - две в первом примере (-0,3 и +0,3), одна во втором (-8), одна в третьем (+0,63) и три в четвертом (0,63, 1,0, -2,0). . Естественно, статистика отклонений, состоягцая из 1-3 разностей, слишком мала и основывать на ней статистические заключения некорректно. Чтобы число этих отклонений было больше, гистограмма должка состоять не из 5 столбцов, а хотя бы из 7-9-11 столбцов. Но согласно формуле (5-11) для того, чтобы гистограмма имела т столбцов, выборка должна содержать я = [6т/(е + 1,5) ] отсчетов. При нормальном распределении с е = 3 для наличия в гистограмме т=7-11 столбцов необходимо я = 170-800 отсчетов, а при равномерном распределении с 8 = 1,8 для т - i=7-11 столбцов нужно я =600-2700 отсчетов. Отсюда и вытекает в качестве приближенной оптимистической ориентировки указание я > 200, однако для m = 9 для тех же распределений нужно, соответственно, 500 и 1080 отсчетов. Корректность использования как критерия Пирсона, так и критерия Колмогорова - Смирнова при таких выборках будет достаточно обеспечена. Но беда в том, что такими выборками по 500-2500 отсчетов экспериментатор практически никогда не обладает, так как для их получения необходима непомерно большая затрата времени и еред<-. 5-6. ВЫЧИСЛЕНИЕ ПО ГИСТОГРАММЕ ОЦЕНОК ШИРИНЫ И ФОРМЫ КРИВОЙ ИССЛЕДУЕМОГО РАСПРЕДЕЛЕНИЯ Определение оценки координаты центра распределения, как было показано выше, производится еще до симметрирования гистограммы, ибо симметрирование осуществляется именно относительно уже выбранного центра. Знание оценки центра необходимо и для расчета оценки ширины распределения в виде с. к. о. и оценки формы распределения в виде эксцесса, так как обе эти оценки определяются через центральные моменты распределения. • Определение оценки ширины распределения в виде энтропийного интервала неопределенности (или его половины как энтро- 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 [63] 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 |