![]() |
|
|
Перейти на главную Журналы были получены какие-то вначения щ и Gj. а вначение коэффициента йя оказалось равным нулю, т. е. точки / и 3 в сечении лежат симметрично относительно точки 2. Если же теперь отбросить точку 1, то обработка оставшихся 11 точек даст примерно те же значения йо и й1,-но будет отрицательно, а если, наоборот, отбросить точку 3, то Са примет положительное вначение. Таким образом, оказывается, что расчетное вначение коэффициента Cg неустойчиво, а значения коэффициентов йо и устойчивы. Подобная плохая обусловленность решения указывает, как правило, границу переусложнения модели. Абсурдные решения могут возникать и по другим причинам. В МНК на определенном этапе производится решение системы уравнений, в ходе которого всегда производится вычитание чисел, которые могут оказаться большими и близкими между собой. Тогда из-за малейшей ошибки в исходных данных их разность может легко измениться в несколько раз и решение будет плохо обусловлено. Покажем это на примере. Пусть используется модель вида у = аХх -\- ах. Для того чтобы вычислить Й1 и йа, надо задать один раз какие-то х и х и измерить у и второй раз задать другие значения Xi и и снова измерить у. Пусть в первом опьпе были заданы Xi = 1 и Xg = Ш и получено = 11, а во втором опыте Xi = 10 и Xg = 101 и получено у = 111. Тогда система уравнений для определения а и йа будет йг1+й2-10= И; Й1-10-Ь flalOl =111. Решение этой системы есть й1 = 1 и Са - 1, что можно проверить подстановкой. Но представим себе, что у =11 было измерено с погрешностью и зафиксировано как у = 11,1. Тогда система уравнений будет ai«l-f йа10 = 11,1; Й1-10-Ь йа.101 = 111. А решение этой системы уравнений есть- % = 11,1 и йа = 0. Вот к какой разнице может привести ошибка измерения у всего в 0,1/11 »; 0,9%. Это значит, что данная система уравнений плохо обусловлена. Иначе говоря, плоскости, определяемые ее уравнениями, имеют между собой очень малый угол. Не останавливаясь на теории этого вопроса, укажем, что практический метод проверки устойчивости решений состоит в поочередном отбрасывании некоторых экспериментальных точек и оценке возникающих вследствие этого изменений получаемого решения. Этот метод мы уже рассмотрели на приведенных выше примерах. Заметим, что наибольшее влияние оказывает, как пра-В-Ило, исключение точек, наиболее удаленных от центра тяжести поля точек, Б то время как исключение центральных точек поля даже в том случае, если они явно выпадают из полосы остальных точек, мало влияет на получаемое решение. Поэтому проверку устойчивости следует проводить путем поочередного отбрасывания крайних, наиболее удаленных от центра точек поля. Для исключения абсурдных решений, получаемых МНК вследствие неоднородности статистики, наличия промахов или других причин неустойчивости, в последние годы интенсивно разрабатываются [44, 471 так называемые «робастные» (термин робастность введен в статистику Дж. Боксом), т. е. устойчивые к неоднородности данных, статистические методы, когда коэффициенты регрессии уточняются путем ряда последовательных итераций, а «мешающие» отсчеты отбрасываются. Программа для вычисления на ЭВМ с одновременным определением степени устойчивости проведена, например, в книге [38]. Программа работает в режиме итераций, а* при расхождении итераций сообщает об этом оператору. Оригинальная робастная программа обработки данных. Эта программа, устойчивая к присутствию промахов, предложена И. Л. Мисюченко (ЛПИ, Ленинград) и основана на использовании медианы пяти оценок центра Xg, описанной в § 3-4. Алгоритм этого метода обработки состоит в следующем. Все поле экспериментальных данных зависимости у = f (х), состоящее из п точек, разбивается на гп групп, как это было показано на рис. 6-3, б. В каждой группе точек находится ее центр, но не просто в виде медианы, а как медиана пяти оценок центра по абсциссам и ординатам точек этой группы. И затем по найденным таким способом центрам МНК определяется аппроксимирующая функция. Такая программа работает в десятки раз быстрее, чем расчет МНК по всему массиву точек, так как время обработки по МНК уменьшается пропорционально квадрату числа обрабатываемых отсчетов и квадрату числа определяемых коэффициентов модели. В результате такая программа ке только устраняет влияние промахов, но за то же время позволяет просчитать несколько вариантов и выбрать наилучший. Затруднение создает необходимость предварительного выбора числа гп групп, на которые делится исходное поле данных. При известном заранее виде модели это решается по правилам, изложенным в § 8-6. Если же вид модели заранее не известен, то приходится прибегать к перебору вариантов, чему и способствует малое время выполнения программы. Если заранее известны наклоны кривой на ее концах, что часто бывает на практике, то вместо МНК более эффективно воспользоваться аппроксимацией сплайн-функцией, позволяющей задать значения производных на границах аппроксимируемого участка, что МНК не позволяет. Если же производные исследуемой зависимости на ее концах заранее не известны, то приближенное значение этих производных можно оценить по взаимному положению медианнБ1х центров двух крайних групп точек с каждого из концов зависимости, но такой прием может оказаться часто и рискованным. Предложенный метод полезен при обработке диффузных исходных данных, содержащих значительное число промахов. Благодаря резкому сокращению числа отсчетов, обрабатываемых по МНК {т центров вместо п исходных точек), метод особенно эффективен при обработке диффузных данных на микропроцессорах и микро-ЭВМ. В своей основе метод схож с методом простых медианных центров, однако обеспечивает достаточно эффективную обработку при любом законе распределения погрешностей исходных данных. Самоадаптирующийся робастный метод обработки данных, являющийся существенным дальнейшим развитием МНК, разработан И. С. Кирилловой и В. Я- Крейновичем (ВНИИЭП, Ленинград) и опубликован в 1983-1985 гг. [18]. В основе метода лежит использование предложенного в 1965 г. И. А. Назаровым (ЛЭТИ, Ленинград) единого математического описания [27] всего разнообразия класса экспоненциальных распределений формулой (2-8) вида р {х) = Л (а) ехр (-л;«), которая при изменении показателя степени а от схэ до О последовательно описывает все распределения от равномерного с эксцессом 8=1,8 и а = оо, через нормальное (в = 3, а = 2), распределение Лапласа (в = 6, а = = 1) и до распределений с бесконечно большим эксцессом (е оо, а-*- 0). Идея самоадаптирующегося алгоритма обработки заключается в следующем. Согласно табл. 5-1 и кривым на рис. 5-1, данные для которых были заимствованы из работы В. И. Мудрова и В. Л. Кушко (1976 г.) [26] по сравнительной эффективности МНК и метода наименьших модулей (МНМ), для нормального распределения, имеющего показатель степени а = 2, наиболее эффективен метод наименьших квадратов и оценка центра математическим ожиданием. Для распределения Лапласа с а = 1 наиболее эффективен метод наименьших модулей и оценка центра медианой. Вообще-то говоря, это следует из метода максимального правдоподобия (ММП). Так, например, для распределений с а = 2 ММП приводит к МНК, для распределений же с а = 4 (см. табл. 5-1) ММП приводит к использованию не минимума суммы квадратов, а минимума суммы четвертых степеней отклонений S Af, для распределений с а =1,5 - минимума S I Л* Д*" распределений с а = 0,75 - минимума S 1 Дг и т. д. Для практического использования этого метода авторами [18] разработан и программно реализован алгоритм обработки данных аналогичный алгоритму МНК, но для произвольно задаваемой как целой, так и дробной степени а. При а = 2 он дает ответ, соответствующий МНК, т. е. среднему арифметическому, при = 1 - соответствующий МНМ, т. е. медиане, а при любом другом заданном значении а (от оо до 0) - обеспечивает получе- 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 [75] 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 |