![]() |
|
|
Перейти на главную Журналы может 6б1ть ввфажен как ар или как cP. а отношение этих величин равно единице! -~ 1, отсюда aja = р. При коэффициенте корреляции р, близком к 1, т. е. при малом рассеянии экспериментальных точек и большой протяженности поля точек, обе линии регрессии близки к оси эллипса и их различием можно пренебречь. При малом же коэффициенте корреляции (р <S 0,96) это различие становится весьма существенным, а сам МНК - неэффективным. В этом случае целесообразно переходить от МНК к методу ортогональной регрессии (см. § 7-4). И, наконец, в качестве существенной особенности МНК следует отметить, что МНК минимизирует абсолютные вначения погрешностей, так как в его основу было положено условие 2 Aj -> min. Следствия этого обсуждались в § 6-4. 6-6. ЧУВСТВИТЕЛЬНОСТЬ М НК К НЕОДНОРОДНОСТИ СТАТИСТИКИ И ОБУСЛОВЛЕННОСТЬ ПОЛУЧАЕМЫХ РЕШЕНИЙ Метод наименьших квадратов - формальный, так сказать» «слепой». В ЭВМ вводятся десятки или сотни произведенных отсчетов, она их в течение какого-то времени обрабатывает и выдает вначения параметров заданной модели. Эти коэффициенты чаще всего определяют функцию, наилучшим образом описывающую экспериментальные данные, но иногда дают просто абсурдные решения, ставящие экспериментатора в тупик. Эти особенности МНК необходимо рассмотреть более подробно. Неоднородность статистики экспериментальных данных. Это наиболее часто встречающаяся на практике причина возникновения абсурдных решений при использовании МНК. Рассмотрим эти явления на простом примере. Пусть исследовалась зависимость от температуры в электрического сопротивления R (0) медной обмотки какого-либо устройства. Предполагалось, что R (6) = == (1 а©), где R„ - сопротивление при 6=0, а а - температурный коэффициент. Были произведены многократные измерения R (©) при температуре 0, равной 20, 40, 60 и 80 °С. При правильном решении эти данные должны выглядеть так, как это показано на рис. 6-11, а, и решение МНК должно было дать R„ = 100 Ом и а = 4-0,4%/К. Однако ЭВМ вывела на печать ответ в виде Rg = 14L015 Ом и а =-0,410791%/К. Ясно, что это абсурдный ответ, так как медная обмотка не может иметь отрицательный температурный коэффициент сопротивления. Для того чтобы понять причину такого решения, целесообразно вывести на печать не только вначения искомых Rg и а, но и исходные данные, с которыми фактически оперировала ЭВМ, а затем вручную или даже с помощью графопостроителя ЭВМ нанести эти данные на график. После построения такого графика чаще всего причина неверного решения становится ясной. Пусть эти данные на графике расположились так, как это показано на рис.б-П, б, т. е. данные, относящиеся к ©, равной 60 и 80 °С, были восприняты ЭВМ, как относящиеся к 0, равной 20 и 40 °С, и наоборот. Причина подобного явления может быть самой различной (например, неверно помечены и введены при перфорации протоколы измерений или присутствует систематическая ошибка при проведении части измерений и т. п.), но итог состоит в том, что для решения МНК была представлена неоднородная статистика. Как видно из рис. 6-И, б, она состоит из двух групп данных, помеченных цифрами 1 и 2. Если проводить решения МНК для этих групп отдельно, то для каждой из них будет получен а = -f0,4%/K, так как линии 1 и 2 приблизительно параллельны линии 4 правильного решения. Совместное же решение МНК этих двух групп данных дает линию регрессии с Rq 140 Ом и а л; -0,4%/К, помеченную-цифрой 3 и проходящую через центры тяжести этих групп. Причиной подобного решения могла быть и другая ошибка. Пусть, например, при вводе данных вместо 6 = 80 было введено 6 = 8,0. Тогда на графике такие исходные данные будут выглядеть так, как это показано на рис. 6-П, е, т. е. будут состоять из однородной статистики для температур 20, 40 и 60 °С, помеченной цифрой 2, и массового промаха, помеченного цифрой /. Ясно, что рассчитанная по таким данным линия регрессии 4 будет проходить через центры тяжести этих двух групп данных и соответствовать абсурдному решению. Ситуация может оказаться близкой к описанной даже в том случае, если в области / (рис. 6-И, е) в виде 5) Ом ![]() в) Ом ![]() О 20 40 60 80 °С Рис. 6-11 О го 40 SO 80 °с ![]() промаха будег всего одна точка. На основании рассмотренного следует заключить, что МНК очень чувствителен к не-9днородности статистики исходных данных и может дать абсурдное решение даже в том случае, если эта неоднородность вызвана наличием всего одного, далеко отстояш.его промаха. Эту особенность МНК надо всегда иметь в виду. Практически это означает, что окончательным должно приниматься решение МНК по однородной, очищенной от промахов статистике. Для того чтобы судить об абсурдности или приемлемости данного ответа, весьма целесообразно еще до решения МНК узнать любым приёлиженным, графическим методом (или из априорных предположений), каков должен быть порядок искомых величин. При получении решения, которое вызывает недоумение, целесообразно построить (вручную или на графопостроителе ЭВМ) графики, подобные рис. 6-11. Если получим график, подобный изображенному на рис. 6-11, б или в, необходимо принять решение, какую fee из групп данных (/ или 2) мы предполагаем обрабатывать. При графике рис. 6-11, е эта задача решается проще, так как при отбрасывании данных области / обработка данных области 2 сразу дает правильное решение в виде линии регрессии 3. С графиком, изображенным на рис. 6-11, б, дело обстоит сложнее, так как обе группы данных (и 1, и 2) являются ошибочными. В подобном случае полезно раздельно обработать каждую из них: -они дадут совпадающие коэффициенты регрессии а = = +0,4%/К, но разные Rf, (область / даст Rg - 115 Ом, а область 2 даст jRo = 95 Ом). Это и укажет на то, где искать ошибку. Обусловленеосгь (устойчивость) решений, получаемых MSiK. Решение задачи, получаемое МНК по экспериментальным данным, (зэдержащим случайные ошибки, естественно, само также случайно. Благодаря усреднению результатов многократных отсчетов оно становится более определенным, более устойчивым. Так, например, линия регрессии на рис. 6-11, а была получена путем усреднения координат 16 точек (по четыре точки в четырех сечениях). Спрашивается, как изменится положение линии регрессии, если ее определять не по 16, а по 15 точкам, опустив одно наблюдение в сечении в = 40 °С? В данном случае положение линии регрессии останется почти тем же самым. Это и доказывает устойчивость (обусловленность) данного решения. Но может быть и по-другому. Представим себе, что обрабатываемые исходные данные располагаются так, как это показано на рис. 6-12, а определению подлежат коэффициенты а, aj и модели у => Со 4- % + «ял; Пусть б каждом из четырех сечений было определено по три икеперимеитальные точки й при обработке по МНК всех 12 точек 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 [74] 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 |