Планирование экспериментов по выяснению регрессивной зависимости

 

Содержание


1. Определение характеристик случайной величины

.1 Определение вида распределения

.2 Построение графиков

.3 Определение точечных и интервальных оценок

. Составление плана эксперимента по выяснению регрессионной зависимости

.1 Осуществление компьютерного эксперимента

.2 Проведение статистической обработки результатов компьютерного эксперимента

Заключение

Список используемых источников

Список используемых программных пакетов

Приложение А



1. Определение характеристик случайной величины


.1 Определение вида распределения


Построим гистограмму по полученной выборке.

Из априорной информации известно, что программа генерирует выборки заданного объема для непрерывной случайной величины. При этом возможны распределения вида: нормальное, равномерное, экспоненциальное, Рэлея.

Полученная выборка приведена в Приложении А.

Построим гистограмму - рисунок 1, рисунок 2.


Рисунок 1 - гистограмма с ожидаемым распределением Рэлея


Рисунок 2 - гистограмма с ожидаемым нормальным распределением

По виду гистограммы можно предположить, что случайные величины в выборке распределены либо нормальному закону, либо по закону Рэлея.

Определим симметрично ли это распределение, с помощью критерия симметричности Кевуя.

В выборке имеются порядковые статистики



Находим


= -29,9


Для ?=0,05 квантиль стандартного нормального распределения равен



Так как


,


гипотеза симметрии отклоняется.

Следовательно, данная выборка не может быть распределена по нормальному закону.

Определим распределена ли выборка по закону Рэлея с помощью критерия Пирсона (критерий «хи-квадрат»)

Сформулируем гипотезы:


H: Fn(x) = R(a)

Выборка распределена по закону Рэлея


H: Fn(x) ? R(a)


Выборка не распределена по закону Рэлея

Интервал значений величины рассчитываем по формуле:



Где xmax - верхняя граница интервала;

xmin - нижняя граница интервала.

Определим число интервалов по формуле:


= 1+3,2*log(100) = 7,4


Где ? - количество интервалов;

n - объем выборки.

Рассчитаем шаг по формуле:



Где ? - количество интервалов

В качестве критерия согласия принимают случайную величину (критерий «хи-квадрат»)


(5)


Где ni - фактическая частота попадания в частичный интервал;i* - теоретическая частота попадания в частичный интервал.

Теоретические частоты попадания в частичный интервал рассчитываем по формуле:


(6)


где n - объем выборки;

рi*- теоретическая вероятность попадания случайной величины в частичный интервал.

При использовании критерия Пирсона для проверки гипотезы о распределении Рэлея генеральной совокупности с предполагаемой функцией распределения


()


необходимо, вычислив по имеющейся выборке значение , оценить параметр a. Так как


и ,


следовательно можно получить систему для определения а* (а* - оценка параметра а).



Отсюда следует, что

~6


Теоретическая вероятность будет рассчитываться по формуле:


,


Где


()


и - границы интервалов.

Результаты расчетов фактической частоты попадания в частичный интервал и теоретической частоты приведены в таблице 1.


Таблица 1

№ интервалаГраницы интервалаniрi*ni*10,8481 - 3,4881120,14514,523,4881 - 6,1281190,25125,136,1281 - 8,7781250,25125,148,7781 - 11,4181250,17917,9511,4181 - 14,0581120,110614,0581 - 16,698160,0434,3716,6981 - 19,338110,0151,5

Рассчитаем значение


= 5,96


По таблице критических точек распределения ?² найдем критическое значение.

Число степеней свободы k определяется по формуле:


k = m-n-1, где


m - число интервалов разбиения

n - число параметров предполагаемого распределения

Распределение Рэлея характеризуется одним параметром а, следовательно,


k = 7 - 1 - 1 = 5.


при ?=0,05 и при числе степеней свободы k=5 ?²кр = 11,1

Так как ?²<?²кр , следовательно нулевая гипотеза принимается, выборка распределена по Закону Рэлея.


.2 Построение графиков


График функции плотности распределения:



График теоретической функции распределения:




График эмпирической функции распределения:


Построим таблицу:

Номер интервалаГраницы интервалаСередина интерваловЭмпирические частотыixi, xi+1zimi10,8481 - 3,48812,16811223,4881 - 6,12814,80811936,1281 - 8,77817,45312548,7781 - 11,418110,098125511,4181 - 14,058112,738112614,0581 - 16,698115,37816716,6981 - 19,338118,01811

,


при , .



.3 Определение точечных и интервальных оценок


Определим точечные оценки:

В качестве оценки параметра а будем считать величину а*, определяемую формулой:


= 6,28


В качестве оценки математического ожидания будем считать величину , определяемую формулой:


= 1,26

= 7,56

В качестве оценки дисперсии будем считать величину , определяемую формулой:


= 15,444


В качестве оценки СКО будем считать величину s(х), определяемую формулой:


= 0,655

s(х) = 3,93


В качестве оценки медианы будем считать величину Ме(х), определяемую формулой:


Ме(х) = = 1,117

Ме(х) = 6,702


В качестве оценки моды будем считать величину Мо(х), определяемую формулой:


Мо(Х) =

Мо(х) = 6


где - параметр распределения

Определим интервальные оценки:

Для определения интервальной оценки параметра воспользуемся программным продуктом MATLAB 6.5.

Для определения доверительного интервала, в котором с вероятностью р = 0,95% находится параметр воспользуемся командой «[p,ci] = raylfit(x)», где x - исследуемая выборка. Параметр находится в границах 4,2202 < < 7,9658.

Выведем формулу для определения объема выборки:



где n - объем выборки;

- квантиль нормального распределения;

? - уровень значимости;

- абсолютная погрешность.

Зададим уровень значимости ? = 0,05 и допустимую абсолютную погрешность = 0,115, тогда = 1,96, следовательно, объем выборки n = 290,48.

Анализ данных был проведен с допустимой абсолютной погрешностью = 0,115 и уровнем значимости ? = 0,05.

случайный величина регрессионный зависимость


2. Составление плана эксперимента по выяснению регрессионной зависимости


.1 Осуществление компьютерного эксперимента


При помощи программы получаем данные для предложенного преподавателем варианта и формулируем задачу.

В химическом процессе выход продукта У(%) зависит от трёх факторов: температуры (X1), давления (Х2) и относительной влажности (Х3). С помощью ПФЭ найти математическое описание процесса в окрестности точки факторного пространства с координатами: : Х1min=5 °С, Х1max=40 °С, Х2min=0,9 атм, Х2max=1,1 атм, Х3min=0,1 , Х3max=1,0.

Для упрощения обработки результатов эксперимента, произведем кодирование значений факторов по формулам:


хi* =(xi - x0i)/?xi,0i = (xi min + xi max)/2,

?xi = (xi max - xi min)/2.


где - натуральное значение i-го фактора;

- натуральное значение основного уровня (центра плана по фактору );

?xi - интервал варьирования фактора;

- кодированный нормированный безразмерный фактор, который принимает значения .

В результате такого кодирования получим матрицу спектра плана в безразмерных величинах



Построим матрицу планирования, используя третий прием, который основан на правиле чередования знаков: в первом столбце знаки меняются поочередно, во втором столбце чередуются через 2, в третьем - через 4


№x0x1x2x3x1x2x1x3x2x3x1x2x3Y11---+++-y121+----++y231-+--+-+y341++-+---y451--++--+y561+-+-+--y671-++--+-y781+++++++y8

Исходя из матрицы планирования, получим следующие результаты эксперимента, представленные в таблицы 5


Таблица 5

Выход продукта в процентах

№12345678Х1540540540540Х20,90,91,11,10,90,91,11,1Х30,10,10,10,11111Y11,19717-64,663754,02398-65,209536,65060-61,912539,85916-64,96568Y2-1,94642-64,668216,35041-62,780262,49339-60,9029110,17944-61,95045Y32,61954-67,795953,00008-65,348867,72118-68,163239,91502-62,29955Y43,03343-66,8655610,06605-65,7438610,03929-67,7737511,38950-65,98963Y5-0,62294-67,254764,15226-67,622084,13631-62,643859,80460-61,24400Определим уравнение регрессии первого порядка.

Формула для определения коэффициентов соответствующего уравнения регрессии первого порядка:


Y = q0f0(x1…xm)+ q1f1(x1…xm)+ …+qpfp+?

?1=0,125(-y1+y2-y3+y4-y5+y6-y7+y8)

?2=0,125(-y1-y2+y3+y4-y5-y6+y7+y8)

?3=0,125(-y1-y2-y3-y4+y5+y6+7+y8)

?12=0,125(y1-y2-y3+y4+y5-y6-y7+y8)

?13=0,125(y1-y2+y3-y4-y5+y6-y7+y8)

?23=0,125(y1+y2-y3-y4-y5-y6+y7+y8)

?123=0,125(-y1+y2+y3-y4+y5-y6-y7+y8)


.2 Проведение статистической обработки результатов компьютерного эксперимента


Для удобства перепишем таблицу в следующем виде:


№12345678Y11,19717-64,663754,02398-65,209536,65060-61,912539,85916-64,96568Y2-1,94642-64,668216,35041-62,780262,49339-60,9029110,17944-61,95045Y32,61954-67,795953,00008-65,348867,72118-68,163239,91502-62,29955Y43,03343-66,8655610,06605-65,7438610,03929-67,7737511,38950-65,98963Y5-0,62294-67,254764,15226-67,622084,13631-62,643859,80460-61,24400Yср0,856156-66,24965,518556-65,34096,208154-64,279310,22954-63,2899Si24,5021232,1991677,9537322,9850898,81365511,74310,4411744,264352

Ycp - среднее значение выхода продукта по строчкам

SiІ - оценки дисперсий по строкам, по следующей формуле



Где l - количество измерений при данном опыте, l=5

Построим расширенную матрицу планирования, используя третий прием построения


№x0x1x2x3x1x2x1x3x2x3x1x2x311---+++-0,85615621+----++-66,249631-+--+-+5,51855641++-+----65,340951--++--+6,20815461+-+-+---64,279371-++--+-10,2295481+++++++-63,2899

Проверим однородности дисперсий по критерию Кохрена.

Определим оценки дисперсий по строкам, по следующей формуле


(l = 5)


Вычислим сумму дисперсий строк:


= 42,90239


Для проверки равноточности необходимо выбрать самую большую из построчных дисперсий и вычислить G - критерий:

=11,7431 (опыт №6)

G=11,7431/42,90239=0,2737


Если , где - табличное значение критерия при числе степеней свободы ?1=l-1 и ?2= n (количество опытов), то опыты равноточные.

Для уровня значимости 0,05 табличное значение Кохрена равно G(4,8)= 0.391

G<Gт - следовательно, опыты являются равноточными.

Тогда общая оценка дисперсии воспроизводимости определяется по формуле:


= 42,90239/8 = 5,36279


Рассчитаем коэффициенты в уравнении регрессии по формулам:


,


b0 = 1/8 (0,856156 - 66,2496 + 5,518556 - 65,3409 + 6,208154 - 64,2793 +

,22954 - 63,2899) = -29,543

b1 = 1/8(- 0,856156 - 66,2496 - 5,518556 - 65,3409 - 6,208154 - 64,2793 -

,22954 - 63,2899) = -35,247

b2 = 1/8(-0,856156+66,2496+5,518556-65,3409 - 6,208154 + 64,2793 +

,22954 - 63,2899) = 1,323

b3 = 1/8(- 0,856156 + 66,2496 - 5,518556 + 65,3409 + 6,208154 - 64,2793

+ 10,22954 - 63,2899) = 1,761

b12 = 1/8 (0,856156 + 66,2496 - 5,518556 - 65,3409 + 6,208154 + 64,2793 -

,22954 - 63,2899) = -0,848

b13 = 1/8 (0,856156 + 66,2496 + 5,518556 + 65,3409 - 6,208154 - 64,2793 -

,22954 - 63,2899) = -0,755

b23 = 1/8 (0,856156 - 66,2496 - 5,518556 + 65,3409 - 6,208154 + 64,2793 +

,22954 - 63,2899) = -0,07

b123 = 1/8 (- 0,856156 - 66,2496 + 5,518556 + 65,3409 + 6,208154 +

,2793 - 10,22954 - 63,2899) = 0,09


Предварительно математическая модель процесса будет выглядеть следующим образом:


Y*= -29,543 - 35,247x1 + 1,323x2 + 1,761x3 - 0,848x1x2 - 0,755x1x3 -

,07x2x3 + 0,09x1x2x3


Оценим значимость коэффициентов, для этого определим дисперсию коэффициентов:


SІbi=SІe/N=5,36279/8=0,6703


Для оценки погрешности (доверительного интервала) коэффициентов найдем табличное значение критерия Стьюдента для доверительной вероятности 0.95 и числа степеней свобод


?=(l - 1)n=32


Табличное значение критерия Стьюдента: t0.95,32 = 1,69. Тогда доверительный интервал коэффициентов равен:


Dbi = tp, f × = 1,69 × = 1,38


Сравним коэффициенты с дисперсией коэффициентов:

|bo| = 29,543 > Dbi - коэффициент значим

|b1| = 35,247 > Dbi - коэффициент значим

|b2| = 1,323 > Dbi - коэффициент значим

|b3| = 1,761 > Dbi - коэффициент значим

|b12| = 0.848 > Dbi - коэффициент значим

|b13| = 0,755 > Dbi - коэффициент значим

|b23| = 0,07 < Dbi - коэффициент незначим

|b123| = 0,09 < Dbi - коэффициент незначим


Отбросив (приравняв нулю) незначимые коэффициенты, получим уравнение связи между откликом у и факторами :


Y*= -29,543 - 35,247x1 + 1,323x2 + 1,761x3 - 0,848x1x2 - 0,755x1x3


Проверим модель на адекватность. Для проверки адекватности полученной математической модели производится оценка дисперсии адекватности:


,


d - число значимых коэффициентов в уравнении

Для того, чтобы оценить дисперсию адекватности, заполним таблицу:


Yj*(-Yj*)(-Yj*)210,8561561,017-0,160840,0258712-66,2496-66,2710,02140,00045835,5185565,3590,1595560,0254584-65,3409-65,321-0,01990,00039656,2081546,0490,1591540,025336-64,2793-64,259-0,02030,000412710,2295410,391-0,161460,0260698-63,2899-63,3090,01910,000365å0,104359

Найдем оценку дисперсии адекватности:


S2ад= 1/(8-6)*1,104359 = 0,55218


Для проверки модели на адекватность воспользуемся критерием Фишера:

Найдем значение критерия Фишера


F=SІад/SІe=0,55218/5,36279= 0,103


Найдем табличное значение критерия Фишера для уровня значимости 0.05 и чисел степеней свобод:


?1 = n - d=2, ?2 = n( l - 1)=32

Fтабл. = 3,294

Fрасч. < Fтабл., из этого следует, что модель адекватна.


После того как мы убедились в адекватности модели стоит произвести ее раскодировку, для этого вместо x1 подставим выражение (x1 - 22,5)/17,5, вместо x2 - выражение (x2 - 1)/0,1, а вместо x3 подставим выражение (x3 - 0,55)/0,45. Благодаря этому, из первоначальной модели:


Y*= -29,543 - 35,247x1 + 1,323x2 + 1,761x3 - 0,848x1x2 - 0,755x1x3


получим следующую модель:

Y = - 29,543 - 35,247 ((x1 - 22,5)/17,5) + 1,323((x2 - 1)/0,1) + 1,761 ((x3 -

,55) / 0,45) - 0,848 (((x1 - 22,5) / 17,5)*(( x2 - 1)/0,1))) - 0,755(((x1 -

,5)/17,5))*(( x3 - 0,55) / 0,45))).


После преобразований получим:


Y=-11,709-1,48x1+24,13x2+6,07x3-0,49x1x2-0,09x1x3



Заключение


В ходе выполнения данной курсовой работы был составлен план по определению характеристик случайной величины. Был определен вид распределения случайной величины - распределение Рэлея, это было подтверждено с помощью критерия Пирсона. Также получены интервальные и точечные оценки параметров распределения. Так как я воспользовалась критерием Пирсона, следовательно, объем выборки я взяла n=100. В дополнении была получена формула для определения объема выборки с заранее заданной абсолютной погрешностью, равно 0,115, и уровнем значимости, равным 0,05. Согласно этой формуле необходимый нам объем выборки для заданной точности составляет n=290.

Во втором задании курсовой работы был проведен компьютерный эксперимент по выяснению регрессионной зависимости между тремя факторами и выходом продукта в химическом процессе. Была построена матрица планирования для определения порядка сбора данных эксперимента. Затем были определены коэффициенты уравнения регрессии первого порядка. Далее была проведена статистическая обработка результатов эксперимента. Была построена расширенная матрица планирования, с помощью которой мы смогли рассчитать коэффициенты в уравнении регрессии. Была получена предварительная модель уравнения связи между откликами и выходом продукта. С помощью критерия Фишера было определено, что полученная модель является адекватной.



Список использованных источников


1. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2006. - 816 с.

2. Е.И. Короткова. Планирование и организация эксперимента. Учебное пособие. Томск: Изд-во ТПУ, 2003, 92с.

3. <#"justify">Список используемых программных пакетов


1.STATISTICA

2.MathCAD 2001i Professional

3.Microsoft Excel

.Matlab 6.5



Приложение А


Выборка


8,84868,40352,2496,296511,46467,1243,28578,16585,44311,2119,32868,96910,42115,09496,1744,32556,704911,20666,16674,99346,959911,09969,58278,97778,17514,91657,66912,6998,328714,40574,151515,287311,813410,61914,376812,55913,83395,201716,33495,27418,34618,57455,17929,25636,81134,26954,798912,57229,616313,41618,49590,848110,401311,36126,9885,43677,36788,79447,34947,0628,325510,869512,74211,53032,30882,71975,31172,185110,12639,67257,03259,454112,92099,68427,948912,859814,93833,72655,86744,24817,01471,946510,08719,044616,32894,24760,969910,112112,283510,12442,89218,85966,03151,218,41949,437612,11613,55912,39298,0316


Содержание 1. Определение характеристик случайной величины .1 Определение вида распределения .2 Построение графиков .3 Определение точечных и ин

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ