Перейти на главную Журналы

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 [83] 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98

на друга и т. д., полагая, что при р I и а. Если же р заметно меньше единицы, то такие действия приводят к существенным невязкам. Таким образом, МНК можно надежно использовать (см. табл. 7-1) лишь при р > 0,96. При этом следует учитывать, что даже при р = 0,96 = 0,92 и различие между и а, которое может возникнуть из-за переноса переменных из правой части уравнения в левую, составляет 8%, хотя такое отклонение линии регрессии в поле экспериментальных точек для глаза и незаметно. Если при преобразовании уравнений образуются члены, например, вида г = ху, то различие может даже утроиться, т. е. достигнуть 24%. Таким образом, необходимо иметь в виду, что при рассеянии исходных данных, характеризующихся pyg <С 0,96, решения МНК могут приводить к ошибочным заключениям.

В связи с этим в математической статистике разрабатывались другие методы, которые могли бы заменить МНК в подобных случаях. Один из таких методов, называемый методом ортогональной регрессии, описывается Ю. В. Линником [20]. Прямая ортогональной регрессии совпадает с осью симметрии эллипса рассеяния экспериментальных точек, т. е. соответствует на рис. 6-10 прямой 3, а не прямым 1 или 2, определяемым по МНК, т. е. несимметричность МНК устраняется.

В дальнейшем этот метод был развит применительно и к многофакторному эксперименту, когда экспериментальные точки образуют облако рассеяния в многомерном пространстве и задача состоит в нахождении уравнений всех плоскостей симметрии этого облака. В этом случае все переменные (как отклик у, так и все факторы Xt) являются равноправными, так как представляют собой оси координат {k + 1)-мерного пространства, в котором и расположено облако рассеяния экспериментальных точек с координатами (ух, Хц, Xki) и которые в этом случае удобнее обозначать как Xi, x,...,Xk, Xk+i-

Для составления уравнений видаа (% - Xj) + а (х - х) + ... ... -f- a+i (Xfe+i - JCfei) = О, определяющих положения гиперплоскости в (ft -f- 1)-мерном пространстве, поступают так. Сумма квадратов расстояний от экспериментальных точек до этой гиперплоскости

M = -L

Если дополнительно положить, что а al + ... -{- al+i == 1 (условие нормирования), то М может быть выражено как М = dDxi + ciDx2 +...+ c§,+iDk+i + 2aia2B (x,, Xg) + ... + + 2aia]B (XiXj) +., где - дисперсия фактора Xj, a

(Xi, Xj) - ковариация факторов Xt и X] при условии i Ф /, когда / =1, (ft-f- 1) и / = 1, (ft -f I).



Поэтому для решения такой задачи должна быть вычислена ковариационная матрица всех k + 1 переменных, имеющая вид

Xs .

IS •

Bzs

• • 2, fe+1

D, .

• • .З, fe+1

Сумма квадратов М сохраняет постоянное значение на {k + 1)-мерном эллипсоиде. Существуют методы, позволяющие найти уравнения всех плоскостей симметрии этого эллипсоида в виде

%Л + -j- . . . -j- Oh+i, iXki = Ci,

....................... (7-5)

1, fe+Л + <h, -j- .. . -j- Obi, =

Одновременно вычисляются суммы квадратов расстояний экспериментальных точек до этих плоскостей. Остаточные дисперсии расстояний точек от найденных плоскостей симметрии носят название собственных значений матрицы, а коэффициенты о, а, dh+i образуют собственный вектор матрицы. Таким образом, решение задачи состоит в расчете всех собственных векторов и всех собственных значений матрицы, для чего используется соответствующая программа для ЭВМ [38, вып. 2, с. 224].

Но полученное решение (7-5) описывает k + I возможных моделей, равное числу всех k + I переменных п k + I гиперповерхностей. Из всех этих моделей физическому смыслу решаемой задачи соответствует только одна модель, которую и нужно отыскать среди них.

Можно, конечно, сравнить все полученные решения по значениям остаточной дисперсии, т. е. по «собственньш значениям», которые также вычисляются для каждой из найденных гиперплоскостей указанной программой. И выбрать из них ту, которая имеет минимальную остаточную дисперсию. Эта гиперплоскость и называется иногда плоскостью ортогональной регрессии.

Однако на практике чаще всего оказывается, что она соответствует тому же абсурдному с физической точки зрения решению, которое для этих исходных данных дает решение МНК. Это объясняется тем, что к описанному методу, являющемуся разновидностью метода главных компонент (МГК), приходится прибегать именно тогда, когда решение МНК Дает ответ, характеризующийся очень малым значением коэффициента множественной корреляции (Руд < 0,96). При этом следует помнить, что при р = 0,9 сигнал (см. таёл. 7-1) только в два раза превышает шум, а при р = 0,7 сигнал и шум равны между собой по мощности.



Поэтому модель, выбираемая по минимуму остаточной дисперсии и по МНК, в большей мере отражает зависимость искомого отклика от шума, чем от исследуемого физического явления.

«Шум» в рассматриваемой задаче - это изменение отклика у под действием факторов, не включенных по тем или иным причинам в рассматриваемую модель. В примере, приведенном на рис. 6-11 или 7-3, «источником» такого «шума» явилось присутствие в части исходных данных систематической погрешности. В других случаях «источниками» такого «шума» могут быть самые разнообразные, но всегда неучитываемые факторы. Их воздействие и приводит к тому, что линия регрессии, имеющая минимальную остаточную дисперсию (например, линия 4 на рис. 6-11, е или 7-3, а), соответствует абсурдному с физической точки зрения решению. Линия же 3 на рис. 6-11, в или 7-3, а, соответствующая искомой физической закономерности, имеет большую остаточную дисперсию и поэтому не может быть найдена МНК.

Описанная же разновидность МГК - это один из возможных впособов генерирования целого ряда п -\- \ возможных моделей (7-5), который применительно к рис. 6-11, в и 7-3, а одновременно дает уравнения как линии 4 с минимальной остаточной дисперсией, так и линии 3 с большей остаточной дисперсией. Поэтому выбор искомой модели из всех предлагаемых МГК моделей (7-5) должен производиться не по минимуму остаточной дисперсии, а по физическому, экономическому, геологическому и т. д. смьюлу решаемой задачи.

7-4. МЕТОДЫ ОТБОРА

НАИБОЛЕЕ ЗНАЧИМЫХ ФАКТОРОВ

И НАИБОЛЕЕ ЗНАЧИМЫХ ЧЛЕНОВ АДДИТИВНОЙ МОДЕЛИ

В § 6-2 подчеркивалось, что основное требование к математической модели, обеспечивающее удобство ее последующего использования, - ее компактность. Обеспечить компактность аддитивной модели - это значит не вводить в нее ни лишних членов, ни тем более лишних факторов. Но это требование входит в прямое противоречие с требованием наибольшей точности описания исследуемого явления. Отбор для включения в модель только тех факторов и тех дополнительных членов, которые действительно повышают точность описания исследуемого явления, может быть осуществлен лишь на основе использования соответствующих методов.

Метод определения значимости членов модели по изменению коэффициента множественной корреляции. Он состоит в следующем. После того как вид модели уже выбран, из нее поочередно исключается каждый из членов, проводится новое решение МНК и определяются оценки pj, коэффициента множественной корреляции. Рассмотрим этот метод на более конкретном примере. Пусть разыскивается модель от трех факторов у = f (%, х, х.




0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 [83] 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98