![]() |
|
Перейти на главную Журналы
После ряда уточнений возникло предположение о целесообразности введения в нее следующих шести членов: у = Пд (цх -\- + (Ы2 -- азХз -- «41 -- сбьЬ G6 у Х2/Х1. используя подстановку х] = х, JCjJc = х5 и VJCj/Xi = Xg, приведем ее к виду д = ао~\- ал -j- OgXg + OsXs -j- ах -f а, + ax. (7-6) Результаты расчета значений коэффициентов множественной корреляции Руд для моделей с поочередным отбрасыванием членов, содержащих х, х, Xg, дали значения р, приведенные в первой строке табл. 7-2. Коэффициент множественной корреляции отражает размер относительной дисперсии точек модели а\ по сравнению с дисперсией значений отклика а, так как оЦо = 1 - рд. Отсюда для оценки значимости в модели каждого из ее членов удобно пользоваться показателем в виде р - р/. Но значения этой разности, как правило, составляют сотые доли единицы, поэтому их удобно умножать на 100, т. е. выражать в процентах (см. табл. 7-2). Сопоставляя эти оценки между собой, можно установить порядковые места по значимости каждого из членов модели. Метод пошаговой регрессии является некоторым упрощением предьщущего метода с одновременной полной или частичной его автоматизацией. Программа пошаговой множественной регрессии [38, вып. 1, с. 210] состоит в следующем. В ЭВМ вводится массив данных о факторах х, х, участвующих в аддитивной модели вида у = Оо + OiXi + ОгХ +...+ аХь. Если вид некоторых членов модели известен заранее (например, известно, что х == х, Хь = хх и Же = у xjxi), то эти подстановки должны быть введены в предварительную программу, которая подготовит массив значений х, дг. Затем ЭВМ начинает поочередно искать решения МНК для моделей Уо = Со, Уг = Од + 01%, 2 = «о + chXi + ах. Уз = = Со + CiXi + CgXa + 03x3, определяя для каждой модели остаточные дисперсии Do, D, Dg, а также их разности, опреде- ляемые внесением в модель каждого последующего фактора, т. е. = Do - Di, Да = Di - Da, Д = Dft i - D. В автоматическом режиме оператором заранее задается желаемое значение остаточной дисперсии Doot и программа останавливается и выводит на печать полученные значения коэффициентов регрессии последней i-й модели, у которой остаточная дисперсия Di < Doct- В полуавтоматическом, диалоговом, режиме производится расчет всех моделей до yj, и на печать выводятся все полученные разности дисперсий от Ai до Д, которые рассматриваются как оценки значимости факторов х, х. Сопоставляя их между собой, оператор сам делает заключение об относительной значимости факторов. Недостаток этого метода состоит в том, что значения Д зависят от того, в каком порядке вводились в модель различные факторы. Поэтому в программе предусмотрено, что оператор может задать целесообразный, с его точки зрения, порядок введения в модель различных факторов, устанавливаемый из каких-то предварительных данных или из сопоставления результатов первого прогона программы. Метод приближенного расчета коэффициентов значимости часто именуется в литературе методом р-коэффициентов. После подстановок любое уравнение модели можно привести к виду уравнения (7-6). Поэтому задача формулируется как определение относительного веса членов уравнения (7-6) по их относительным вкладам в результирующее значение отклика у. Перепишем эти равенства для измененной системы отсчета, когда начало координат перенесено в точку пространства с координатами Ха» •••» Xi. Тогда Si-y = ai{Xa - Xi)-\-a2{Xi2 - x-\-..., где 1 = 1, п. Проведем теперь операцию нормирования, разделив все члены этого равенства на Oj,, а члены правой части, кроме того, умножив и разделив на ai- Тогда получим Хц-Xi I Рх2 Xiz - Xz Су "" 0V Cxi Оу Ох, • где i - Тп. Здесь {у1 - у)/ау, {хц - хуах и т. д. - центрированные и нормированные случайные величины, представленные выборками объема п, а Pi = aiOxi/Oy, Ра = аОх/Оу, р, = = aiai/Oy - по существу, суть веса их относительного вклада в значение отклика. Удобство использования р-коэффициентов значимости членов аддитивной модели обусловлено простотой их расчета по формуле Pj = ajajlOy. Однако при использовании этого метода необходимо иметь в виду следующие его особенности. Так как а.] и Oj, - величины положительные, то р получает знак коэффициента регрессии aj, который может быть как положительным, так и от-рицательньш. Поэтому не следует удивляться, что иногда получается, например, j = -2, но Pg = +2,5, а Рз = -0,5. Знаки при р-коэффипиентах во внимание не принимаются, а значимость оценивается по соотношению их модулей. Приближенность р-коэффициентов определяется прежде всего тем, что случайность малой выборки приводит к существенному разбросу оценок и aj, и Oj, который зависит от объема выборки п, числа определяемых коэффициентов I, эксцесса распределений и коэффициента множественной корреляции Руд. Так, например, при / = 4, п = 24, р = 0,9 и 8 = 3 относительное с. к. о. р составляет бр = 20%, а следовательно, Yo,9 = 1.6 = 32%. Поэтому при использовании метода р-коэффициентов следует придерживаться следующего правила. Если Р-коэффициенты двух членов модели различаются между собой менее чем в 1,3-1,5 раза в ту или другую сторону, то такие члены должны признаваться равнозначньши. Различная значимость признается лишь тогда, когда Р-коэффициенты различаются более чем в 1,3- 1,5 раза. 7-5. ОЦЕНКА ПАРАМЕТЮВ ОБЛАСТИ НЕОПРЕДЕЛЕННОСТИ ИСХОДНЫХ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ МНОГОФАКТОРНОГО ЭКСПЕРИМЕНТА Вид области неопределенности исходных данных многофакторного эксперимента. Как было уже показано, при определении зависимости у = f {х) область неопределенности экспериментальных данных - это полоса в двухмерном пространстве, на плоскости {х, у) (см. рис. 6-1). При этом разделить погрешности, внесенные при измерении переменных х или у, уже невозможно (см. § 6-1). Поэтому неопределенность экспериментальных данных при измерении зависимости у = f (х) характеризуется совокупно (и по X, и по у) указанием коэффициента корреляции или других параметров совокупной полосы неопределенности. При многофакторном эксперименте для определения многомерной зависимости у = f {х, х) это явление еще более усиливается, так как область неопределенности обусловлена в этом случае суммированием всех погрешностей измерений vi.y,vi.Xi, ...,х. Другой особенностью области неопределенности исходных экспериментальных данных является то, что эта область в данном случае представляет собой уже не интервал (рис. 4-1, а) и не полосу (рис. 4-1, б), а (й + 1)-мерный слой, располагающийся по обе стороны {k -f- 1)-мерной поверхности отклика. Изобразить это графически можно только для двухмерного пространства факторов, располагающегося на плоскости х, х, и трехмерного пространства отклика у ~ f (%, х - рис. 7-4, а. Здесь изображена функция отклика у = yj (в, ф) жизнедеятельности почвенных бактерий в зависимости от температуры в 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 [84] 85 86 87 88 89 90 91 92 93 94 95 96 97 98 |