Перейти на главную Журналы

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 [67] 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98

f {к, v) В области 0,2 < и < 0,745, т. е. от точки 7 до точки 10 Q погрешностью менее 5% по формуле

Ср - 0,77 + 35,6 [0,8 (ftn - kf + - ft) (и 0,288) + 0,025>t],

(5-28)

рде кп -Упе/2. Показатель степени экспоненциальной составляющей композиций определяется по соотношению, аппроксимирующему в той же области зависимость а =f (к, к) с погрешностью до 12% i

а == [6,87 -8,71 (1.5J-1.9x)(fe-l,87) 12/3

L (0,7332 -5«)/>« J

И, наконец, при невыполнении условия (5-26) при к < 1,87 исследуемое распределение.признается двухмодальным и рассматривается как композиция дискретного двузначного распределения (точка 1 на рис. 5-11) и различных экспоненциальных распределений с а от 2 до 1/2. Относительное содержание дискретной составляющей характеризуется показателем Сд == (Тдискр/<эксп - с;/СТэксп и с погрешностью менее 5% может быть найдено по аппроксимирующему соотношению

Сд = 0,9 iV- к) - 0,06)/(0,775 - 0,46х), (Б-30)

а показатель степени а определяется по аппроксимирующему (с погрешностью 6%) выражению

„ ПЯ1 2,12x-2.8x-f 0.65

" - "3 + 8,83x2-9,34x + 0,13 + /fe •

При использовании соотношений (5-28)-(5-31) должно учита-ваться, как было показано применительно к соотношению (Б-27), что используемые в них оценки км% были определены по выборке с погрешностями +Л (ft) и ±Л (к). Эти погрешности вычисляются по соотношениям (5-24) и (5-25). С учетом интервалов неопределенности используемых оценок ft и и ответ ЭВМ будет: «Распределение представляет собой композицию равномерного и экспоненциального распределений с содержанием равномерной составляющей от Сртш до Сршах И эксгюненциальной составляющей с показателем степени от ащ до осах»- В зависимости от объема анализируемой выборки эти интервалы могут быть существенно различными и четко характеризуют область неопределенности полученного результата.

5-9. О ДОСТОВЕРНОСТИ ОПРЕДЕЛЕНИЯ ФОРМЫ РАСПРЕДЕЛЕНИЯ ПО МАЛОЙ ВЫБОРКЕ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Методы идентификации формы распределения экспериментальных данных представляются столь совершенными, что могут ввести в заблуждение относительно действительных возможно-



стей такой идентификации. Это относится особенно к методам аналитической аппроксимации полигонов (§ 5-4) и проверке выдвинутых гипотез критериями согласия (§ 5-5).

Применение аппроксимации полигонов распределений (рис. 6-2, 5-6 и Б-7) и проверка этих гипотез с помощью критериев согласия были лишь иллюстрацией, призванной помочь читателю в освоении этих методов. Одновременно отмечалось, что малость критериев согласия отнюдь не является показателем того, что по малой выборке (с п =40-50 отсчетов) достоверно определена функция распределения генеральной совокупности. Это обусловлено прежде всего тем, что аппроксимация и критерии согласия применяются к данной конкретной выборке экспериментальных данных. Если эксперимент повторить несколько раз, то каждый раз полигоны, а следовательно, и аппроксимируюш,ие функции будут получаться разными. Вследствие этого достоверность идентификации вида распределений дри п < 200 не может быть надежно оценена (см. конец § 5-Б) критериями согласия. Ее можно оценить расчетом интервалов показателей формы распределения по соотношениям (5-24) и (5-25).

Пример оценки границ интервала неопределенности показателей фор1Уы кривой распределения. Гистогра1мма этого распределения была приведена на рис. 5-2. Параметры этого распределения, рассчитанные без поправок на группирование и объем выборки (см. табл. 5-7 в § 5-6) при объеме выборки п. = 52, числе столбцов m = Б, ширине столбца d = 8, были получены равными о* =8,68, 8* =2,17 и и* --=0,68. С учетом поправки Шеппарда на группирование, согласно формуле (5-20), с. к. о. будет а ~~ = 8,68 У\ - (8/8,68)712 = 8,68-6,964 =8,37. Четвертый момент, вычисленный без поправок, составляет [а = 2 Xjni/n ~ =-- 638 976/52 = 12 288, а с поправкой на группирование согласно формуле (5-21) получает значение JI4 = 12 288 -- (8,37-8)/2 + + (7-8*)/240 = 10 167 (поправка существенна и составляет -17%), а дополнительно с поправкой на объем выборки согласно выражению (5.22) = Д (1 -f-4/п) - 6а«/« =10 167 (1 -f 4/52)- - (6-8,37*)/52 = 10 949 - Б66 == 10 383, т. е. эта поправка незначительна и составляет всего --2%. Отсюда значение эксцесса будет Б = nJa* = Ш 383/8,37* = 2,12 и контрэксцесса к = 1/Ув == == 1/]Л2,12 =0,69. Согласно выражению (5-24) неопределенность оценки контрэксцесса вследствие малости выборки

Ао,9 (и) = 1,6а (и) 1,6и K(?=lf/1/29R =1 = 1,6-0,69 К(2,12 - 1)W29T52 = 0,07.

Таким образом, интервал неопределенности оценки контрэксцесса этого распределения вследствие малости выборки с доверительной вероятностью Р = 0,9 ограничен пределами: Кщт = 0,69 - 0,07 = 0,62 и »сп,ах 0,69 + 0,07 = 0,76. (Отсюда,



кстати, видно, что поправки незначительно влияют на результат \ по сравнению с интервалом неопределенност-и и в неответственных

случаях могут и не использоваться.) \ При сохранении в силе гипотезы, что данное распределение дописывается экспонентой с показателем степени 2 < а < с», (полученные значения Иц,ш = 0,62 и хаах = 0,76 должны быть интерпретированы следующим образом. Согласно соотношению (5-27) для экспоненциалыюхо распределения с Ктт == 0,62 показатель степени экспоненты а = (1,355 - 0,622)/1п 15/(9-0,622) J == 2,6, а для Кпмх = 0,76 значение а не существует, так как уже при и = /5/9 = 0,745 значение а = с», ибо распределение становится равномерным. Таким образом, располагая выборкой п = 52, мы вправе лишь утверждать, что а лежит в пределах от 2,6 до с» и что значение к генеральной совокупности лежит в пределах 0,62 < к < 0,76, т. е. распределение генеральной совокупности не являет-ся нормальным (и = 0,577), а принадлежит к классу распределений, близких к трапецеидальным. Однако каков вид этой трапеции, установить при п = 52 нельзя, так как интервал возможных значений контрэксцесса (0,62 < и < 0,76) шире, чем диапазон -я трапецеидальных распределений: от и = = 0,645 и Ё =2,4 (для треугольного) до и =0,745 и ё = 1,8 (для равномерного).

Чтобы интервал значений %, соответствуюшцй трапецеидальным распределениям, мог быть разделен хотя бы на три части (0,645 ± 0,025 - распределения, близкие к треугольному, 0,695 ± d= 0,025 - трапецеидальные и 0,745 ± 0,025 - близкие к равномерному), необходимый объем выборки может быть найден из выражения (5-24):

п > 1,6V /"р/[29 {Ак)% (5-32)

Отсюда для рассматриваемой выборки с и =0,69, в =-.2,12 будет обеспечено Ао,9 (а) < 0,025 при

п > 2,56-0,69 ]/(2,12 - Ifim (0,025)2] 440,

Подобным путем необходимый объем выборки может бьпъ найден по формуле (6-32) в любом конкрехтюм случае. Однако необходимо отметить, что увеличение объема выборки исходных данных до ft = 400 или п = 4000 далеко не всегда обеспечит возможность надежной идентификации формы распределения экспериментальных данных. Следует иметь в виду, что все приведенные формулы были получены в предположении о непрерывности "закона распределения и независимости каждого из получаемых отсчетов от положения на числовой оси уже Полученных" ранее. На практике эта непрерывность и независимость очень часто нарушаются, а в теории вероятностей нет кри» герия для оценки степени такого несоответствия.




0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 [67] 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98