Перейти на главную Журналы

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 [81] 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98


Рие. 7-2

жащие произведения XjXs, < XjXs ИТ. д., называют членами, отражающими попарное взаимодействие факторов, члены вида XiXXg - членами тройного взаимо-дейспшия и т. д. (см. [2, 9, 21, 26, 46]). Однако при увеличении числа k факторов модель в виде гиперболоида становится чрезвычайно громоздкой. Модель гиперплоскости (7-2) требует определения k + 1 коэффициента, для чего, в теории планирования эксперимента разработаны предельно экономные планы в виде так называилых дробных регулярных реплик, в то время как в модели многомерного гиепрболоида (7-3) содержится 2 коэффициентов и для их определения требуется постановка такого же числа опытов, называемых в теории планирования полным факторным планом. Ясно, что 2* > ft + 1, так, например, при ft = 6 ft + 1 = 7, а 2 = 64.

7-2. МЕТОДЫ ОПРЕДЕЛЕНИЯ

ПО ЭКСПЕРИМЕНТАЛЬНЫМ ДАННЫМ

ВИДА И ПАРАМЕТРОВ МАТЕМАТИЧЕСКОЙ МОДЕЛИ

МНОГОФАКТОРНОЙ ЗАВИСИМОСТИ

Для выбора вида многофакторной математической модели на практике используются лишь два метода: метод последовательной графоаналитической аппроксимации частных (базисных) функций отклика от отдельных групп факторов с последующей композицией их в общую многофакторную модель (см. § 6-2) и противоположный ему метод эвристического назначения какой-либо формальной модели. Выбор одного из этих методов прежде всего обусловлен наличием априорных сведений о возможном виде искомой математической модели исследуемого явления, а также степенью диффузности (разброса) исходных экспериментальных данных.

Важность использования априорных данных. Исследователю, впервые изучающему какое-либо новое явление, как правило, кажется, что все необходимые данные он должен извлечь из своего эксперимента, так как исследование для того и проводится. Однако при более внимательном анализе часто выясняется, что это не так, что очень многие данные могут быть установлены еще до постановки опыта и что они во многом обусловливают искомую модель, а опыт служит лишь для уточнения деталей этой модели.

Пусть, например, мы столкнулись с совершенно новой для нас задачей - составить тест, который за 24 ч мог бы численно характеризовать плодородие данного образца почвы инвариантно к ее температуре 0 и влажности ф (пример основан на фактическом материале, заимствованном из автореферата диссертации



Е. В. Соловьева «Исследование углекислотного режима корне-обитаемых сред»). Задача, действительно, является новой, и искать готовый ответ на нее в книгах по агротехнике, вероятно, бесполезно. Ни пшеница, ни тем более яблоня за 24 ч дать урожай не могут. Но для пробного посева могут быть использованы бактерии с коротким жизненным циклом, а в качестве количественного критерия интенсивности их жизнедеятельности может использоваться, например, количество q выделяемого ими COg в единицу времени. Таким образом, математическая модель исследуемого явления есть q = qj (©, ф), где и есть численный показатель качества почвы.

На первый взгляд, кажется, что у нас нет никаких данных о виде функции f (©, ф), описывающей влияние температуры © и влажности ф на жизнедеятельность почвенных бактерий, так как мы не имеем нужных агрономических знаний. Но это не так. Кто не знает, что при 0 = О °С вода замерзает и, следовательно, СОа выделяться не может, а при © = 80 °С производится пастеризация, т. е. большинство бактерий погибает. Априорных данных вполне достаточно, чтобы утверждать, что искомая функция имеет колоколообразный характер, близка к нулю при © = О °С и 0 = 80° С «, следовательно, имеет максимум внутри этого интервала. Подобные же рассуждения о функции влияния влажности позволяют заключить, что она имеет максимум в области Ф » 20% и спадет до нуля при ф = 0% и ф = 40% (жидкая грязь). Вид этой функции показан ниже на рис. 7-4, а. Таким образом, действительной задачей эксперимента является лишь уточнение характера спадов этого колокола в области © = 20-ьЗО °С и 0 = 5060 °С, а также при ф =10-15% и ф =:25-г-30% и более точное установление координат максимума.

Подобное положение обнаруживается при более внимательном анализе в большинстве других сложных исследовательских задач, поэтому максимальное использование априорных данных, резко сужающих круг возможных моделей, должно быть одним из основных правил при поиске модели сложных явлений.

Диффузность исходных экспериментальных данных является важным фактором, определяющим путь выбора модели. Если эти данные позволяют построить семейства графических зависимостей типа изображенных на рис. 7-1, б, т. е. их диффузность позволяет выделить не только уровень, но и наклон, и кривизну, а возможно, и изменения кривизны частных зависимостей, то в этом случае следует, безусловно, идти путем последовательной аппроксимации этих частных зависимостей, отыскивая затем вид их композиции между собой в единую математическую модель (рис. 7-1, в).

Если же, наоборот, попытки построения частных зависимостей у =fi (xj), у =U fe) и т. д. приводят к расположению экспериментальных точек в виде картины «звездного неба» (рис. 6-3, а), то наиболее рациональным путем понека решения является зада-



Число N различимых градаций отклика

Относительная приведенная по1ешность V.

Коэффициент множественной корреляции Руд

0,96

0,98

0,99= 1-

-10-2

0,999= 1-

-10-3

0,9999= 1-

-10-*

0,25

0,99999= 1-

-10-5

ние функции отклика в виде описанных в § 7-1 аддитивных (гиперплоскости и гиперболоида) или мультипликативной моделей, так как при значительной диффузности исходных данных (рис. 6-3, а) и большом числе факторов {к >- 3) какие-либо попытки «осмыслить» исходный экспериментальный материал путем построения и анализа частных зависимостей вида у =fi (xj), у =f2 (Ха) и т. д. чаще всего совершенно не продуктивны. Они лишь создают у исследователя видимость настойчивой деятельности и надежды, что решение «вот-вот будет найдено», в то время как в действительности отгадать искомую модель в таких условиях почти невозможно.

Использование коэффициента множественной корреляции для оценки качества получаемого решения. Шкала численных значений коэффициента корреляции pyg весьма своеобразна. Для ее правильного восприятия полезно сопоставить значения pyg, относительной приведенной погрешности у и числа N различимых градаций полосы разброса экспериментальных данных. Такое сопоставление в соответствии с формулами (6-13) и (6-14) сделано в табл. 7-1. При у = ±50% интервал неопределенности составляет 2у = 100%, т. е. разброс экспериментальных данных вокруг модели занимает весь диапазон изменения отклика и не позволяет тем самым установить даже угол наклона этой зависимости. Такому положению соответствует р = 0. При у = ±25% интервал разброса составляет 2у = 50% от диапазона изменения отклика, что позволяет различить только две его градации (от О до 50% и от 50 до 100%). Этому соответствует значение р == 0,9, и поле точек может иметь вид рис. 6-11, б или в. При р =0,96 может быть различено = 3 градации отклика, при р = 0,98 - iV = 4 и т. д. (см. рис. 6-11, а).

Если считать достаточным для приближенного определения функции отклика возможность различения в поле экспериментальных данных хотя бы 2-3 градаций, то это значит, что приемлемым значением коэффициента корреляции р является лишь р, большее 0,9-0,96. Весь же диапазон изменения р от О до 0,9




0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 [81] 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98