![]() |
|
|
Перейти на главную Журналы деленной генеральной совокупности Xf подчиняется соотношению (2-13). При публикации этого соотношения Госсет решил подписать работу псевдонимом Student, поэтому распределение (2-13) и получило в литературе название «распределение Стьюдента». Квантили распределения Стьюдента для двустороннего симметричного доверительного интервала приведены ниже: и ... 2 3 4 5 7 10 15 20 30 оо 4,9 . . 6,31 2,92 2,35 2,13 1.94 1,83 1,76 1.73 1,70 1,64 <о.95 . . 12,7 4,30 3.18 2,78 2,45 2,26 2,14 2.09 2,04 1,96 Пользование ими состоит в том, что при и < 30 доверительное значение погрешности оценки X находится как ==- 0,9 или До.95х = "г . (4-5) уп уп При уменьшении объема выборки п, по которой находится оценка S„£ для ai, значения i Стьюдента резко возрастают: при п = 3 До,в5 = 4,3Sa.j, а при и = 2 Ао,9б = 12,75».. Однако при п > 8 отличие квантилей распределения Стьюдента от квантилей нормального распределения (и = оо) составляет уже менее 20%. Для распр.еделений х, отличных от нормального, использование распределения Стьюдента некорректно. 4-3. СРАВНИТЕЛЬНАЯ ЭФФЕКТИВНОСТЬ РАЗЛИЧНЫХ МЕТОДОВ ОПРЕДЕЛЕНИЯ КООРДИНАТЫ ЦЕНТРА РАСПРЕДЕЛЕНИЯ Известен целый ряд оценок координаты центра симметрии распределения: среднее арифметическое, медиана, центр размаха и др. При статистической обработке экспериментальных данных важно использовать наиболее эффективную оценку, так как погрешность в определении координаты центра распределения влечет за собой неправильную оценку с. к. о., границ доверительного интервала, эксцесса и контрэксцесса, вида распределения и т. п., т. е. всех последующих оценок, кроме энтропийных. При этом большая затрата времени и других ресурсов для получения многократных отсчетов имеет целью прежде всего уточнение именно координаты центра распределения, и если для этого используется неэффективная оценка, то в соответствующее число раз непроизводительно возрастают затраты на достижение желаемого результата. Если считать, что затрата времени на проведение измерений пропорциональна числу п осуществленных отсчетов, то целесообразно сравнивать различные оценки именно по числу п, необходимому для достижения одинаковой дисперсии оценки центра распределения. Проведем такое сравнение для оценки координаты центра распределения в виде медианы Х„, т. е. 50%-ной квантили эмпирического распределения. Дисперсия определенной по выборке с объе- п координаты любой квантили, соответствующей вероятно-[17, с. 404]. D [Хр] = Р (1 - Р)1{п \р {Xp)f }, (4-6) где р {хр) - плотность распределения в точке Хр-, Хр - координата квантили. Для медианы Р = 0,5 и ее дисперсия D (Хм) = 1/{4п [р X X (Хм) 1*}- Например для распределения Лапласа вида р (х) = = А ехр (-z) = ехр (-\хУ2/а\)/{аУ2) плотность в центре распределения, т. е. при X = О, составляет р (Хц) = 1/(а/2). Отсюда дисперсия рассеяния оценки медианы для распределения Лапласа D [Х] = oV(2n), (4-7) где а = ai- Сопоставляя дисперсию оценки координаты центра в виде медианы Хм согласно выражению (4-7) и в виде среднего арифметического X согласно (4-2) видим, что для распределения Лапласа D [Хм] в два раза меньше, чем D [X], т. е. определение координаты центра медианой в два раза эффективнее, а следовательно, для достижений той же погрешности требуется в 2 раза меньший объем выборки исходных данных. В общем случае для класса экспоненциальных распределений р (х) == Л ехр (-Ixp) можно показать, что относительная эффективность оценки координаты центра медианой по сравнению со средним арифметическим, оцениваемая как отношение дисперсий при равных объемах выборки Е = D (X)/D (Хм), £м = аГ (3/а)ДР (1/а)], где-а - показатель степени экспоненты. Это точное соотношение для распределений с эксцессом от 8 = 3 до е = 8 (0,577 > х > >0,35) может быть аппроксимировано (с погрешностью 5-10%) функцией вида м 0,128-б. Для иллюстрации изложенного кривая изменения эффективности медианы в функции от контрэксцесса нанесена на графике рис. 4-2, а и помечена знаком Х. Эта кривая пересекается с горизонтальной прямой Е = 1, соответствующей эффективности среднего арифметического, при к = 0,515. Для островершинных распределений с и < 0,515 оценка координаты центра медианой эффективнее, чем оценка в виде Ж Таким образом, оценка центра .в виде среднего арифметического отнюдь не является эффективной для всех распределений. Оценка в виде медианы эффективна только для островершинных распределений. Для плосковершинных и двухмодальных распределений эффективность медианы падает вплоть до нуля. Это иллюстрируется рис. 4-3, где одновременно с формой распределений засечками схематически показано расположение эксперимен-
с с/ 0,6 0,8 1 ![]() ![]() \г1 а75 Рис. 4-3 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 [46] 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 |
||||||||||||||||||||||||||||||