Перейти на главную Журналы

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 [65] 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98

однако при п > 6 это выражение по прааила« гфиближенных вычислений значительно упрощается, получая вид

f4 ==---- Й4 (1 + 4 г) 6a-Vn. (5-22)

Обе эти поправки должны вводиться последовательно, т. е. в предыдущие формулы в качестве должно подставляться gHa4eHHe [.ц, уже исправленное в соответствии с формулой (6-22). Пример использования этих поправок будет приведен в § 6-9.

Неоднозначность суждений, получаемых при анализе малых выборок. Неоднозначность, уже упоминавшаяся при обсуждении критериев согласия, сутдествует" и при аналитическом расчете оценок ширины и формы распределения по его гистограмме. Так, в рассмотренном примере при графическом сглаживании и симметрировании мы получили гистограмму (рис. 5-7) с = 12,5, а при расчетном симметрировании - гистограмму (рис. 5-6) с == = 12,2. Относительное различие этих оценок составляет у (а) ==

(12,2 - 12,5)/12,2 -0,025 = --2,5%. Относительное различие оценок контрэксцесса и энтропийного коэффициента этих гистограмм составляет, соответственно, у (к) = (0.60 - - 0,63)/0,60 = -0,05 = -5% и у (к) = (1,95 - 1,99)/1,95 = := -0,02 = -2%. Однако среднее квадратическое значение возможных отклонений, обусловленных не методом симметрирования гистограммы, а самим фактом малости выборки (п = 38) и формой закона распределения, согласно формулам (4-8)-(4-10), составляет (при ё == 2,52 и А = 1,99):

6 (о*) = а(о*)/а* = УГ=11{2 Уп) .= =----1/2,52-1/(2 УЩ 0,10 10%; б {%*) -=--а {х*ух* = jW/yn == fpt5~n)»/]/29 = 0,10 = 10%; 6 (А*) - а {k%ik* :== 1 \k I-rT]/ -

- 1 /1,99 /"Г99Тз8"/рр == 0,04 4 %.

Таким образом, неоднозначность оценок графического или расчетного симметрирования гистограмм с у .ш, ественно меньше неопределенности, обусловленной случайностью малых выборок исходных данных и видом закона распределения.

S-7. ПРИБЛ1ЩЕННАЯ ИДЕНТИФИКАЦИЯ ФОРМЫ РАСПРЕДЕЛЕНИЯ ПОГРЕШНОСТЕЙ ПО СОЧЕТАНИЮ ОЦЕНОК КОНТРЭКСЦЕаА И ЭНТРОПИЙНОГО КОЭФФИЦИЕНТА С ИСПОЛЬЗОВАНИЕМ ТОПОГРАФИЧЕСКОЙ КЛАССИФИКАЦИИ

Как было показано в предыдуш,ем параграфе, числовые оценки формы распределения в виде контрэксцесса и и энтропийного коэффициента k даже при малом o6be;vie выборки эксперименталь-




о 0,1 0,3 0,4 0,5 0,6 0,7 0,8 0,3 1,0

Рис. 5-U

ных данных {п 40) определяются уже с достаточной точностью (у = 5-1-10%). Этим можно воспользоваться для вынесения суждения о виде формы кривой исследуемого распределения с помощью топографической классификации математических моделей распределений в координатах k и к, которая была показана на рис. 2-10. Действительно, вычислив оценки и к и нанеся точку с этими координатами на плоскость k - к, можно, кроме визуального впечатления от вида полигона, получить еще одно независимое формальное указание на возможную форму кривой распределения.

Для практического осуществления метода приближенной идентификации необходимо иметь более подробную топографическую классификацию законов распределения в плоскости k - к, чем та, что была приведена на рис. 2-10. Такая классификация показана на рис. 5-11. На ней линия, соединяющая точки 2-5-4, как и на рис. 2-10, есть геометрическое место точек, соответствующих семейству распределений Стьюдента с числом степеней свободы v от 1 до оо. Линия, соединяющая точки 2-5-6-7-8-9-4-10, есть геометрическое место точек, соответствующих классу экспоненциальных распределений с показателем степени а от О до оо. Точка 2 соответствует распределению с а О, точка 5 - с а



s= i/4, ТОЧЕН b-8 соответствуют значениям a, равнБШ 1/3, 1/2, g/3, точка 9 соответствует распределению Лапласа с а = 1, точка 4 (с а == 2) - нормальному распределению Гаусса и точка 10 (с а- оо) - равномерному распределению.

Для описания уплощенных высокоэнтропийных распределений (с ft i> lj87) использованы распределения класса шапо, т. е. композиции равномерного распределения (точка /0 с различными экспоненциальными распределениями. Геометрические места точек таких композиций расположены на рис, 5-11 на линиях, соединяющих точку 10 с точками соответствующих экспоненциальных распределений, начиная от линии 5-10 (помеченной значением а == 1/4), линии 6--10 (а =1/3) и т. д. до линии 4-10, являющейся геометрическим местом точек, соответствующих композициям нормального (точка 4) и равномерного (точка 10) распределений.

Для описания низкоэнтропийных распределений (к < 1,87) использованы композиции экспоненциальных распределений с дискретным двузначным распределением вида р (х) = 0,5 б {х - а) + -\- 8 {х + а)] (точка / на рис. 5-11). Геометрические места точек таких распределений расположены на рис. 5-11 по линиям, соединяющим точки 5, 6, 7, 8, 9 п 4 с точкой / и помеченным значениями а = 2, а == 1, а = 2/3 и т. д. до а = 1/4. Относительное содержание дискретной составляющей в таких распределениях удобно характеризовать отношением С = а/а, где а - полуразмах дискретного распределения, а о - с. к. о. экспоненциального. Линии равных С та1сже нанесены на рис. 5-11.

Кроме того, на рис. 5-11 нанесены геометрические места точек трапецеидальных распределений в виде линии, соединяющей точку 10, соответствующую равномерному распределению, и точку 11, соответствующую треугольному распределению, а также композиций двух арксинусоидальных распределений ~- линия, соединяющая точку 12 (арксинусоидальное распределение) и точку 13 (композиция двух равных арксинусоидальных распределений).

Метод исиолйзования тоиографической классификации распределений (рис. 5-11) для вынесения суждения о возможной форме распределения генеральной совокупности, из которой была получена исследуемая выборка, cвoдгfcя к следующему. Так, например, для полигона распределения на рис. 6-6 в § 6-6 были получены оценки = 0,63 с относительной погрешностью от малой выборки {п = 38) уу. == 10% я = 1,99 с 7 = 4%. Таким образом, контрэксцесс этого распределения лежит в пределах от 0,57 до 0,69, а энтропийный коэффициент в пределах от 1,91 до 2,07. Прямоугольник с этими границами наносится на график рис, Б-li и очерчивает область распределений, к которым можею принадлех<ать исследуемая выборка. На этом основании утверждается, что исследуемое распределение не может принадлежать к; распределениям, находящимся вне этого прямоугольника




0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 [65] 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98