![]() |
|
|
Перейти на главную Журналы кривым рис. 4-2, а, рационально вычислить все пять оценок (Х„, Хс, Хр, Xo,s, X) и за оценку центра Хц для дальнейших вычислений принять оценку Х5, занявшую медианное положение в их вариационном ряду. Достоинство такой оценки состоит в том, что она полностью защищена от наличия промахов и поэтому не требует их предварительного удаления. В литературе, однако, нет исследования эффективности такой оценки центра. Поэтому ее эффективность была определена путем моделирования на ЭВМ случайных выборок для следующих законов распределения: Коши (х = 0), Лапласа (х = 0,408), Симпсона (х = 0,645)", равномерного (х = 0,745) и арксинусойдального (х = 0,816). Для каждого распределения на ЭВМ формировалось по 100 выборок с объемом от п = 9 через Дп = 8 (т. е. 17, 25, 33, 41, 49 и т. д.) до п = 97. Для распределения Коши из-за большой затраты машинного времени максимальный объем выборок был ограничен п = 49. Для каждой группы из 100 выборок данного объема находилось 100 значений оценок X, Х., Хр, Х0.5, X и Х5 и по ним вьгчислялась оценка с. к. о. их рассеяния. Для оценки Хр наблюдалась резкая зависимость с. к. о. от объема выборки. Для остальных,же оценок был характерен лишь случайный разброс с к. о. для различных объемов выборок, поэтому было произведено усреднение их дисперсий и найденные таким образом средние значения с. к. о. для выборок с п от 9 до 97 использовались для вычисления относительной эффективности различных оценок центра Х{ относительно оценки Х5 в виде = oIs/oIm, -Ее == = Oxs/oxc, Exo.s = (Ashxo.b к Ex = 0x5/они нанесены на график рис. 4-2, б и приведены ниже: к........... О 0,408 0,645 0,745 0,816 Ее.......... 0,88 0,77 0,73 0,78 0,93 Ей.......... 2,17 1,14 0,65 0,41 0,25 ......... 1,72 1,28 0,80 0,69 0,50 Е- .......... О 0,75 1,07 1,20 1,28 Из этих кривых видно, что оценка центра Хц = Xg для распределений от Коши до нормального (0.< и < 0,58) более эффективна, чем X и Хс, а для распределений с 0,58 < х < 0,83 более эффективна, чем Х„, Хо,б. Таким образом, Хц = Х5 позволяет определять координату центра до удаления промахов во всем диапазоне реальных распределений погрешностей с х от 0,4 до 0,83 примерно с такой же эффективностью, как Хм в области распределения Лапласа, или X и Хо,б - в области нормального. Окончательное округление оценки Хц производится по правилам, изложенным в § 1-4, в соответствии с оценкой погрешности этой оценки. Это может быть сделано (см. § 5-3) в соответствии с формулами (4-3) и (4-5). 4 4 РАССЕЯНИЕ ОЦЕНОК С. К. О., КОНТРЭКСЦЕССА. ЭНТРОПИЙНОГО ЗНАЧЕНИЯ И ЭНТРОПИЙНОГО КОЭФФИЦИЕНТА В ЗАВИСИМОСТИ ОТ ОБЪЕМА ВЫБОРКИ И ЭКСЦЕССА РАСПРЕДЕЛЕНИЯ Рассеяние оценки с. к. о., определяемой по формуле (4-4), зависит от объема выборки п и эксцесса распределения е. Дисперсия выборочной дисперсии согласно работе [39, с. 320] D [D*] = ----- J{n - 1) - о* (п - 3)/[п (п - 1) ], где и - второй и четвертый центральные моменты генеральной совокупности, т. е. для оценки неопределенности оценки дисперсии нужно знать второй и четвертый моменты. При п >> 20 можно с погрешностью 10% полагать п - 3 /г - 1, что приводит к приближенным соотношениям [17, стр. 387]: D [D*\ = (fji4 - (f)ln и о (о*) = У\1 - а«/(2о]/ п). Последнее равенство можно преобразовать следующим образом: а (а*) = УЫ( - 1) o-V(2 Уп) = а ]/Т=П/(2 УТь), где е = = 1X4/0* - эксцесс распределения. Отсюда относительная средняя квадратическая погрешность S (о*) определения оценки о* зависит только от объема выборки п и эксцесса распределения и не зависит от о, т. е. от точности, с которой производятся измерения: fi (о*) = а {а*)/а = УГ/ (2 Уп). (4-8) Для данного вида распределения она может быть уменьшена только путем увеличения объема выборки. Рассеяние оценки контрэксцесса к для различных законов распределения выражается разными формулами. Можно показать, что относительная средняя квадратическая погрешность fi (х) = = У D (к) [17, стр. 384-388 ] для равномерного распределения (е = 1,8, и = 0,74) fi (к) = ]/32/(315п), для нормального распределения (е = 3, к = 0,577) fi (к) = ]/"2/(Зп), для распределения Лапласа (а = 1, е = 6, и = 0,4) fi (к) = ]/33/(4п), а для экспоненциального распределения с показателем степени а = 0,5 (е = , = 25,2, к = 0,199)fi (к) = УЕ57/п. Эти соотношения с погрешностью, не превосходящей 8-10%, можно приближенно аппроксимировать единой формулой: 6 (к) = о {%*)/% у(е2- 1)8/]/29п. (4-9) Рассеяние оценок энтропийного коэффициента и энтропийного значения погрешности. Для приближенного определения выражений для расчета этих оценок на ЭВМ были сформированы выборки случайных чисел, подчиненных различным законам распределения (арксинусоидальному, равномерному, трапецеидальному, треугольному, нормальному и распределению Лапласа), с объемами выборок от 30 до 200. Путем многократных повторных формирова-
НИИ выборок и расчета их параметров были определены с. к. о. получаемых оценок энтропийного коэффициента и энтропийного значения случайной величины. Результаты такого моделирования при малых объемах выборок (п = 30-f-200) имели очень большой разброс. Для иллюстрации этого в табл. 4-2 приведены полученные оценки с. к. о., оценки энтропийного коэффициента, вычисленные для разных законов и разных объемов выборок. Вследствие большого разброса этих данных они были аппроксимированы методом наименьших квадратов. Полученные результаты могут рассматриваться лишь как весьма приближенные. Тем не менее их анализ позволяет получить достаточно полную качественную картину рассматриваемого вопроса. Аппроксимация этих данных может быть произведена следу-юш;ими выражениями (погрешность адекватности неизвестна): a(k). - - ; e(*) = °-f Уы у-у? 9,15-10- 5,1 (1 -nf (4-10) Из выражений (4-8) - (4-10) необходимый объем выборки экспериментальных данных для получения соответствующей статистической оценки с заданной относительной средней квадратиче-ской погрешностью S соответственно равен: По = (е M, = ]/(e2-l)V(29fi2); пи==\1{тУЩ, = [5,1 (1 - -f 9,15.10-*/(1 - yifW. Рассчитанные по этим соотношениям объемы выборок Па, п, и Пдв для получения оценок а, %, k и А. с относительной средней квадратической погрешностью S = 0,05 = 5%, изображены Б виде кривых на рис. 4-4 в функции от значений контрэксцесса к. Для значений к < 0,577 эти кривые рассчитаны для экспоненциальных распределений, а для к > 0,577 - для двухмодальных 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 [48] 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||