![]() |
|
Перейти на главную Журналы![]() Рис. 7-3 соответствует тому, что в полосе экспериментальных данных невозможно достоверно различить даже двух градаций изменения искомой функции отклика. Какие-либо утверждения о виде функции отклика в этих условиях не могут быть обоснованными. Поэтому утверждения типа «...в результате этого коэффициент корреляции возрос с р = 0,27 до р = 0,68, т. е. более чем в 2,5 раза...», не имеют смысла, хотя нередко встречаются, например, для «научного подтверждения» существования телепатии. Если врезультате решения диффузной задачи по модели, назначенной волевым образом, получен коэффициент корреляции р <С 0,9, то задачу нельзя считать окончательно решенной (см. рис. 6-И, б, где р = 0,9, или рис. 6-П, е, где р = 0,8). Использование графических методов анализа. Часто существенную помощь в подобной ситуации оказывает нанесение экспериментальных данных в соответствии с полученной (плохой) моделью на график вида у =f {у)- Причиной неудачи часто является неоднородность исходных экспериментальных данных, вследствие чего график у =f {у) получает вид рис. 7-3, а или б. Этот график построен на основании тех же данных, которые на рис. 6-11, б или в были представлены в координатах у = = / (х). На рис. 7-3 повторена та же нумерация полей и линий, что и на рис. 6-11. Но принципиальное различие этих графиков состоит в том, что поля точек на рис. 6-11 могут быть построены только для однофакторного эксперимента, а графики рис. 7-3 - для сколь угодно сложного многофакторного эксперимента. Таким образом, если на графике у =f (у) возникла ситуация, показанная на рис. 7-3, а, то, видимо, мы ввели в ЭВМ для обработки по МНК резко неоднородные исходные данные. Полученная модель в виде линии 4 не соответствует исследуемому явлению, так как полоса 2 экспериментальных точек лежит не вдоль, а поперек линии этой модели. Это вызвано наличием данных в области /. Логическая часть анализа такой ситуации состоит в принятии решения о том, какую же часть такой статистики надо обрабатывать, а какую - следует отбросить. Можно отбросить крайние группы данных в области 2, тогда центр области 2 и область / дадут решение в виде линии 4 с хорошим коэффициентом корреляции р4. Или же можно опустить из рассмотрения группу данных области 1, тогда три оставшихся группы данных в области 2 дадут решение в виде линии 3 также с хорошим значением pg.. Выбор между этими двумя решениями из чисто математических соображений может легко приводить к абсурду. Поэтому он должен производиться с точки зрения «здравого смысла», а не путем сравнения остаточной дисперсии или, что то же самое, путем сопоставления оценок рз и р4. Так, возвращаясь к рис. 6-11 и вспомнив, что в данном случае у - это электрическое сопротивление медной обмотки, которое с ростом температуры 0 (или одного т Xj =0 при многофакторной зависимости) должно возрастать, следует принять решение в виде линии 3, а не линии 4, даже в том случае, если Рз < Р4. Если построение данных в виде графика у =f (у) дает картину рис. 7-3, б, то оно показывает, что решение в виде линии 3 имеет плохой коэффициент корреляции вследствие того, что обе полосы данных 1 п 2 лежат не вдоль, апоперек линии 3. В этом случае имеет смысл провести раздельные решения для полосы / и для полосы 2, а затем попытаться представить себе физический смысл всех трех решений. В данном случае мы получим, что решение 3 абсурдно, так как дает для меди отрицательное значение температурного коэффициента, а решения в виде линий 1 и 2 - не абсурдны, так как дают почти равные в обоих случаях положительные значения этого коэффициента. Таким образом, задача в значительной степени уже решена, но остается найти причину расхождения этих двух (правильных по темпу и знаку прироста) решений, различающихся лишь «постоянной составляющей». Цензурирование данных с использованием «плохой» модели. Картины, подобные рис. 6-11 или 7-3, могут возникнуть как вследствие каких-либо устранимых ошибок (например, наличия промахов), так и в результате диффузности самих исходных экспериментальных данных. В гл. 4 были подробно рассмотрены методы обнаружения и удаления промахов. Но ими невозможно воспользоваться при многофакторном эксперименте, пока он не приведен к виду у =f (у) с использованием сколь угодно «плохой» модели. Поэтому использование назначенной волевым образом модели позволяет решить эту задачу путем построения на ее основе графика у =fQ) (рис. 6-14, б или 7-3) и удаления промахов из выбранной полосы. Однако при решении вопроса о признании некоторых наблюдений отсчетами, относящимися к выборке из другой генеральной совокупности, следует в качестве главного критерия опираться на изложенные выше соображения «здравого смысла», т. е. на известные физические, экономические и т. п. закономерности. Так, например, получив график у =t Q) (рис. 7-3,а) по правилам исключения промахов, можно с совершенно равным правом исключить края области 2 и оставить ее центр и область / или, наоборот, исключить область 1 и оставить все три группы в области 2. Поэтому в трудных случаях приходится параллельно использовать оба варианта, а выбор производить уже между полученными моделями 5 и 4 по их физическому смыслу. Подбор аппроксимирующих базисных функций методом выделения остатка. После использования назначенной модели и удаления с ее помощью наблюдений, принадлежащих другой генеральной совокупности, уже может открываться возможность дальнейшего решения задачи методом выделения остатка (см. § 6-2) и подбора аппроксимирующих базисных функций для отдельных факторов или их групп с последующей их композицией в общую формулу модели. При этом, пользуясь методом выделения остатка, при отыскании вцда базисных функций путем построения частных зависимостей необходимо каждый раз использовать и те точки (из области / на рис. 7-3, а), которые при более «грубой» модели вели себя как промахи. Очень часто при использовании уточненной модели, правильнее учитывающей влияние и взаимодействие всех факторов, многие из точек, казавшихся «промахами» при «грубой» модели, хорошо ложатся в полосу точек при более совершенной модели и даже помогают установить адекватный вид базисных функций. 7-3. МЕТОД ОРТОГОНАЛЬНОЙ РЕГРЕССИИ КАК ЧАСТНЫЙ СЛУЧАЙ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ (МГЮ Основным недостатком МНК является его несимметричность по отношению к аргументу и функции, о чем уже говорилось в § 6-5. Отсюда вытекает практическое ограничение области надежного использования МНК. Переменные при МНК неравноправны между собой, и перенос их из правой части уравнения в левую приводит к другому решению. Но при подготовке аппроксимирующих уравнений к решению МНК такие переносы часто необходимы, как мы уже видели выше на примерах уравнений (6-2) или (6-3) в § 6-4. Вследствие несимметрии МНК в таких случаях вместо решения в виде линии / (рис. 6-10) мы получаем решение в виде линии 2. Различие этих решений (см. § 6-5) определяется значением квадрата коэффициента множественной корреляции, так как Поэтому если р близко к единице, то несимметрией МНК можно пренебрегать и переносить переменные из одной части уравнения в другую, перемножать их между собой, делить друг 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 [82] 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 |