Перейти на главную Журналы

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 [77] 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98


Рис. 6-14

коэффициент корреляции, наоборот, есть показатель тесноты их группирования относительно принятой модели. Эти оценки характеризуют одно и то же свойство этих данных и поэтому взаимосвязаны между собой.

Однако коэффициент корреляции вначений Xt и применительно к однофакторной зависимости у = / (д:) характеризует тесноту группирования данных лишь относительно некоторой прямой (например прямой 3 на рис. 6-10). При более сложной зависимости (рис. 6-14, а) коэффициент корреляции ру будет оценивать тесноту экспериментальных точек относительно некоторой прямой, обозначенной буквой Л, что, естественно, несет мало сведений о тесноте их группирования относительно искомой кривой 1-2-3.

Поэтому оценка разброса экспериментальных данных значением коэффициента корреляции pj, может бьиь использована лишь только для линейной однофакторной модели вида Р = = Оо + (hx.

Однако существует понятие коэффициента множественной корреляции, расчетная оценка которого правомерна для любых многофакторных зависимостей, в том числе и для сложных нелинейных однофакторных зависимостей. Пояснить смысл этого понятия, не прибегая к строгим математическим выкладкам, можно следующим образом.

Если используемая в качестве модели функция у =f {х) есть однозначная функция х, т. е. любому заданному х соответствует лишь одно определенное значение у, то при отсутствии погрешностей экспериментальных данных тождество у = у изобразится в координатах у =f (у) (рис. 6-14, б) в виде биссектрисы прямого угла, как бы ни была сложна используемая модель. Если же погрешность экспериментальных данных не равна нулю, т. е. экспериментальные точки на рис. 6-14, а располагаются не на кривой /-2-3, а в некоторой полосе вдоль этой кривой, то на рис. 6-14, б экспериментальные значения yi расположатся в некоторой полосе вокруг прямой у = f Q). Это обусловлено тем, что каждому значению х соответствует (при однозначной



модели) лишь одно вначение у, а экспериментальные вначения у Ери заданном х могут быть как больше у, так и меньше.

Коэффициент корреляции рр между экспериментальными значениями уг и полученными по модели у при разных х и принято называть коэффициентом множественной корреляции. Его использование одинаково правомерно как для действительно многофакторных моделей вида у = f {х, Xi), так и для сложных однофакторных моделей, когда х, xt суть просто разные функ-XIMM pf 9 sin Х; Ы хит. д.) одной переменной х,.

Построение графиков экспериментальных данных в виде у 6= f (у), подобных рис. 6-14, б, очень полезно для окончательной наглядной оценки полученной модели. Для того чтобы представить себе, как деформируется полоса погрешностей (рис. 6-14, а) три произвольные точки (i, 2, 3) помечены на обоих рисунках одинаковьГми цифрами.

К графику рис. 6-14, б, где все экспериментальные точки расположены вдоль прямой у =f (у), понятие коэффициента корреляции применимо без каких-либо оговорок и, как уже упоминалось в § 3-1, он составляет

* Ргр = 1/"1И-КЫ/Т-(0д№ (6-10)

где 0д - с, к. о. экспериментальных точек от прямой у у, а oj, - с. к. о. тех же точек от горизонтальной прямой на уровне у. Тел как в дальнейшем под р будет всегда пониматься значение рдд, то индексы далее будут опущены.

Оценка егд есть абсолютная оценка ширины полосы разброса, а сценка Oj, есть оценка ширины диапазона изменения значений у. Отношение этих величин есть некоторое подобие относительной приведенной погрешности, употребляемой обычно для характеристики погрешности Ку приборов с учетом длины (У„) их диапазона измерений. Но, определяя приведенную относительную погрешность как f = Аг Ук» обычно под Ь.у понимают не всю ширину полосы неопределенности, а лишь ее половину, в то время как под Fa - не отклонения у от у, а весь диапазон изменения от mm ДО Утях Отсюда аналогом относительной приведенной погрешности в первом приближении следует считать у aJiCy). С учетом .этого отношение ojoy, входящее в выражение (6-10), можно считать равным удвоенной относительной приведенной погрешности, т. е. (0д/0у) 2у. Тогда соотношение (6-10) примет вид

РУТШ (6-П)

или, наоборот,

ff-LyiZI. (6-12)

Дальнейшее уточнение соотношения между р и у может быть введено исходя из следующих рассуждений. Под приведенной



погрешностью у обычно понимают не с. к. о. 6, а какую-то интервальную (доверительную или энтропийную) оценку. Соотношение между ними определяется, естественно, видом закона распределения (см. гл. 3 и 5). В данном же случае форма распределений, характеризуемых од и Оу, резко различна. Распределение, имеющее с. к. о. Су, определяется размещением экспериментальных точек по оси у (на рис. 6-14, б - это кривая 4). Оно более близко к равномерному. Поэтому для него энтропийное значение можно принять Аэ1 V3oj,. Распределение же, характеризуемое с. к. о. Од, помечено на рис. 6-14 цифрой 5 и определяется погрешностями экспериментальных точек. Оно чаще всего бывает колоко-лообразным. Полагая его в среднем в какой-то степени близким к нормальному, его энтропийное значение примем Agg = 2,066од. Отсюда энтропийное значение относительной приведенной погрешности экспериментальных данных будет

2,066 Од

т. е. Од/сТу = УЗУэ- С учетом этого вместо выражений (6-11) и (6-12) получаем более уточненные соотношения!

Р=УТ=ГЗЩ; (6-13)

?э = У"(1-р)/3. (6-14)

Сопоставляя соотношения (6-12) и (6-14), следует заметить, что (6-12) более справедливо при р < 0,9, а (6-14) - при р > 0,9 (см. табл. 7-1).

Эти соотношения дают возможность очень простой приближенной оценки коэффициента корреляции pyg по формуле (6-13). Для этого достаточно полуширину полосы погрешностей поделить на диапазон изменения у, а далее по (6-13) рассчитать pyg.

И, наоборот, располагая в результате обработки на ЭВМ более точным значением р, найденным по формуле (6-9), можно по (6-12) или (6-14) рассчитать более точное значение энтропийной оценки погрешности экспериментальных данных, основанной на средней квадратической оценке отклонений всех экспериментальных точек от кривой регрессии.

Здесь необходимо обратить внимание читателя на два обстоятельства. Во-первых, расчет оценки р по формуле (6-9) удобно программно совместить с обработкой по МНК, так как в (6-9) входят те же Z Z Хгу что вычисляются и для МНК. Для этого в программе МНК необходимо лишь дополнительно предусмотреть вычисление Zy\, которая нужна для вычисления р и не нужна в программе МНК. (Необходимые готовые программы см., например, в работе [38].)

Во-вторых, получаемая оценка относительной приведенной погрешности разброса исходных экспериментальных данных в виде




0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 [77] 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98