Планирование эксперимента и статистическая обработка результатов измерений

 

ОГЛАВЛЕНИЕ


ВВЕДЕНИЕ

1.ОСНОВЫ МАТЕМАТИЧЕСКОГО ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА

1.1 История возникновения планирования эксперимента

1.2 Основные понятия и определения

1.3 Представление результатов экспериментов

1.4 Применение математического планирования эксперимента в научных исследованиях

1.5 Требования, предъявляемые к факторам при планировании эксперимента

1.6 Ошибки опыта

2.ПОЛУЧЕНИЕ СОВОКУПНОСТИ СЛУЧАЙНЫХ ВЕЛИЧИН

2.1Расчёт оценок математического ожидания, дисперсии и среднеквадратического отклонения

2.2Исключение резко выделяющихся экспериментальных данных

2.3Расчет относительных характеристик рассеяния случайной величины

2.4Определение ошибки среднего и границ доверительного интервала

2.5Доверительный объем испытаний

3.ПОСТРОЕНИЕ ГИСТОГРАММЫ И ПОЛИГОНА ИМПЕРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ

4.ПРОВЕРКА ОСНОВНОЙ ГИПОТЕЗЫ

5.ТОЧЕЧНАЯ И ИНТЕРВАЛЬНАЯ ОЦЕНКА. СРАВНЕНИЕ ДВУХ ВЫБОРОК

6.ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ

7.ТРЁХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ

8.КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ

9.СПОСОБ ОБРАБОТКИ ЭМПИРИЧЕСКИХ ДАННЫХ

СПИСОК ЛИТЕРАТУРЫ


ВВЕДЕНИЕ


При измерении свойств продуктов легкой промышленности и разработке методов оценки технологических параметров, как правило, изучается совокупность случайных величин. Которая может быть определена основными числовыми характеристиками: средним значением, дисперсией, коэффициентом вариации, квадратической неровнотой и т.д.. Известно, что числовые характеристики меняются от выборки к выборке и являются также случайными величинами, которые варьируют с заданной доверительной вероятностью в определенном интервале. Чем больше ошибка числовой характеристики, тем шире интервал. Точность каждой числовой характеристики определяется ее ошибкой, а надежность - доверительной вероятностью. Задаваясь точностью и надежностью при известной дисперсии случайной величины, можно определить доверительный объем испытаний для оценки числовой характеристики.

Целью данной курсовой работы является изучение методов определения основных числовых характеристик и получение начальных навыков работы с совокупностью случайных величин.



1. ОСНОВЫ МАТЕМАТИЧЕСКОГО ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА


.1 История возникновения планирования эксперимента


Планирование эксперимента - продукт нашего времени, однако истоки его теряются в глубине веков.

Истоки планирования эксперимента уходят в глубокую древность и связаны с числовой мистикой, пророчествами и суевериями.

Это собственно не планирование физического эксперимента, а планирование числового эксперимента, т.е. расположение чисел так, чтобы выполнялись некоторые строгие условия, например, на равенство сумм по строкам, столбцам и диагоналям квадратной таблицы, клеточки которой заполнены числами натурального ряда.

Такие условия выполняются в магических квадратах, которым, по-видимому, принадлежит первенство в планировании эксперимента.

Согласно одной легенде примерно в 2200 г. до н.э. китайский император Ю выполнял мистические вычисления с помощью магического квадрата, который был изображен на панцире божественной черепахи.

Квадрат императора Ю

9 2

5 7

1 6

Клетки этого квадрата заполнены числами от 1 до 9, и суммы чисел по строкам, столбцам и главным диагоналям равны 15.

В 1514 г. немецкий художник Альбрехт Дюрер изобразил магический квадрат в правом углу своей знаменитой гравюры-аллегории «Меланхолия». Два числа в нижнем горизонтальном ряду A5 и 14) составляют год создания гравюры. В этом состояло своеобразное «приложение» магического квадрата.

Квадрат Дюрера

3 2 13

10 11 8

6 7 12

15 14 1

В течение нескольких веков построение магических квадратов занимало умы индийских, арабских, немецких, французских математиков.

В настоящее время магические квадраты используются при планировании эксперимента в условиях линейного дрейфа, при планировании экономических расчетов и составлении рационов питания, в теории кодирования и т.д.

Построение магических квадратов является задачей комбинаторного анализа, основы которого в его современном понимании заложены Г. Лейбницем. Он не только рассмотрел и решил основные комбинаторные задачи, но и указал на большое практическое применение комбинаторного анализа: к кодированию и декодированию, к играм и статистике, к логике изобретений и логике геометрии, к военному искусству, грамматике, медицине, юриспруденции, технологии и к комбинации наблюдений. Последняя область применения наиболее близка к планированию эксперимента.

Одной из комбинаторных задач, имеющей прямое отношение к планированию эксперимента, занимался известный петербургский математик Л. Эйлер. В 1779 г. он предложил задачу о 36 офицерах как некоторый математический курьез.

Он поставил вопрос, можно ли выбрать 36 офицеров 6 рангов из 6 полков по одному офицеру каждого ранга от каждого полка и расположить их в каре так, чтобы в каждом ряду и в каждой шеренге было бы по одному офицеру каждого ранга и по одному от каждого полка. Задача эквивалентна построению парных ортогональных 6x6 квадратов. Оказалось, что эту задачу решить невозможно. Эйлер высказал предположение, что не существует пары ортогональных квадратов порядка п=1 (mod 4).

Задачей Эйлера, в частности, и латинскими квадратами вообще занимались впоследствии многие математики, однако почти никто из них не задумывался над практическим применением латинских квадратов.

В настоящее время латинские квадраты являются одним из наиболее популярных способов ограничения на рандомизацию при наличии источников неоднородностей дискретного типа в планировании эксперимента. Группировка элементов латинского квадрата, благодаря своим свойствам (каждый элемент появляется один и только один раз в каждой строке и в каждом столбце квадрата), позволяет защитить главные эффекты от влияния источника неоднородностей. Широко используются латинские квадраты и как средство сокращения перебора в комбинаторных задачах.

Возникновение современных статистических методов планирования эксперимента связано с именем Р. Фишера.

С 1918 г. он начал свою известную серию работ на Рочемстедской агробиологической станции в Англии. В 1935 г. появилась его монография «Design of Experiments», давшая название всему направлению.

Дальнейшие развития этих идеи было планирование, ортогональное к неконтролируемому временному дрейфу, которое следует рассматривать как важное открытие в экспериментальной технике - значительное увеличение возможностей экспериментатора.


.2 Основные понятия и определения


Под экспериментом будем понимать совокупность операций совершаемых над объектом исследования с целью получения информации о его свойствах. Эксперимент, в котором исследователь по своему усмотрению может изменять условия его проведения, называется активным экспериментом. Если исследователь не может самостоятельно изменять условия его проведения, а лишь регистрирует их, то это пассивный эксперимент.

Важнейшей задачей методов обработки полученной в ходе эксперимента информации является задача построения математической модели изучаемого явления, процесса, объекта. Ее можно использовать и при анализе процессов и при проектировании объектов. Можно получить хорошо аппроксимирующую математическую модель, если целенаправленно применяется активный эксперимент. Другой задачей обработки полученной в ходе эксперимента информации является задача оптимизации, т.е. нахождения такой комбинации влияющих независимых переменных, при которой выбранный показатель оптимальности принимает экстремальное значение.

Опыт - это отдельная экспериментальная часть.

План эксперимента - совокупность данных определяющих число, условия и порядок проведения опытов.

Планирование эксперимента - выбор плана эксперимента, удовлетворяющего заданным требованиям, совокупность действий направленных на разработку стратегии экспериментирования (от получения априорной информации до получения работоспособной математической модели или определения оптимальных условий). Это целенаправленное управление экспериментом, реализуемое в условиях неполного знания механизма изучаемого явления.

В процессе измерений, последующей обработки данных, а также формализации результатов в виде математической модели, возникают погрешности и теряется часть информации, содержащейся в исходных данных. Применение методов планирования эксперимента позволяет определить погрешность математической модели и судить о ее адекватности. Если точность модели оказывается недостаточной, то применение методов планирования эксперимента позволяет модернизировать математическую модель с проведением дополнительных опытов без потери предыдущей информации и с минимальными затратами.

Цель планирования эксперимента - нахождение таких условий и правил проведения опытов при которых удается получить надежную и достоверную информацию об объекте с наименьшей затратой труда, а также представить эту информацию в компактной и удобной форме с количественной оценкой точности.

Пусть интересующее нас свойство (Y) объекта зависит от нескольких (n) независимых переменных (Х1, Х2, …, Хn) и мы хотим выяснить характер этой зависимости - Y=F(Х1, Х2, …, Хn), о которой мы имеем лишь общее представление. Величина Y - называется «отклик», а сама зависимость Y=F(Х1, Х2, …, Хn) - «функция отклика».

Отклик должен быть определен количественно. Однако могут встречаться и качественные признаки Y. В этом случае возможно применение рангового подхода. Пример рангового подхода - оценка на экзамене, когда одним числом оценивается сложный комплекс полученных сведений о знаниях студента.

Независимые переменные Х1, Х2, …, Хn - иначе факторы, также должны иметь количественную оценку. Если используются качественные факторы, то каждому их уровню должно быть присвоено какое-либо число. Важно выбирать в качестве факторов лишь независимые переменные, т.е. только те которые можно изменять, не затрагивая другие факторы. Факторы должны быть однозначными. Для построения эффективной математической модели целесообразно провести предварительный анализ значимости факторов (степени влияния на функцию), их ранжирование и исключить малозначащие факторы.

Диапазоны изменения факторов задают область определения Y. Если принять, что каждому фактору соответствует координатная ось, то полученное пространство называется факторным пространством. При n=2 область определения Y представляется собой прямоугольник, при n=3 - куб, при n >3 - гиперкуб.

При выборе диапазонов изменения факторов нужно учитывать их совместимость, т.е. контролировать, чтобы в этих диапазонах любые сочетания факторов были бы реализуемы в опытах и не приводили бы к абсурду. Для каждого из факторов указывают граничные значения


, i=1,… n.


Регрессионный анализ функции отклика предназначен для получения ее математической модели в виде уравнения регрессии


Y=F(X1,X2,...,Xn;B1,B2,...,Bm)+e


где В1, …, Вm - некоторые коэффициенты; е - погрешность.

Среди основных методов планирования, применяемых на разных этапах исследования, используют:

планирование отсеивающего эксперимента, основное значение которого выделение из всей совокупности факторов группы существенных факторов, подлежащих дальнейшему детальному изучению;

планирование эксперимента для дисперсионного анализа, т.е. составление планов для объектов с качественными факторами;

планирование регрессионного эксперимента, позволяющего получать регрессионные модели (полиномиальные и иные);

планирование экстремального эксперимента, в котором главная задача - экспериментальная оптимизация объекта исследования;

планирование при изучении динамических процессов и т.д.

Инициатором применения планирования эксперимента является Рональд А. Фишер, другой автор известных первых работ - Френк Йетс. Далее идеи планирования эксперимента формировались в трудах Дж. Бокса, Дж. Кифера. В нашей стране - в трудах Г.К. Круга, Е.В. Маркова и др.

В настоящее время методы планирования эксперимента заложены в специализированных пакетах, широко представленных на рынке программных продуктов, например: StatGrapfics, Statistica, SPSS, SYSTAT и др.


1.3 Представление результатов экспериментов


При использовании методов планирования эксперимента необходимо найти ответы на 4 вопроса:

Какие сочетания факторов и сколько таких сочетаний необходимо взять для определения функции отклика?

Как найти коэффициенты В0, В1, …, Bm?

Как оценить точность представления функции отклика?

Как использовать полученное представление для поиска оптимальных значений Y?

Геометрическое представление функции отклика в факторном пространстве Х1, Х2, …, Хn называется поверхностью отклика (рис. 1).


Рис. 1. Поверхность отклика


Если исследуется влияние на Y лишь одного фактора Х1, то нахождение функции отклика - достаточно простая задача. Задавшись несколькими значениями этого фактора, в результате опытов получаем соответствующие значения Y и график Y =F(X) (рис. 2).

Рис. 2. Построение функции отклика одной переменной по опытным данным


По его виду можно подобрать математическое выражение функции отклика. Если мы не уверены, что опыты хорошо воспроизводятся, то обычно опыты повторяют несколько раз и получают зависимость с учетом разброса опытных данных.

Если факторов два, то необходимо провести опыты при разных соотношениях этих факторов. Полученную функцию отклика в 3х-мерном пространстве (рис. 1) можно анализировать, проводя ряд сечений с фиксированными значениями одного из факторов (рис. 3). Вычлененные графики сечений можно аппроксимировать совокупностью математических выражений.


Рис. 3. Сечения поверхности отклика при фиксированных откликах (а) и переменных (б, в)


При трех и более факторах задача становится практически неразрешимой. Если и будут найдены решения, то использовать совокупность выражений достаточно трудно, а часто и не реально.


.4 Применение математического планирования эксперимента в научных исследованиях


В современной математической теории оптимального планирования эксперимента существует 2 основных раздела:

планирование эксперимента для изучения механизмов сложных процессов и свойств многокомпонентных систем.

планирование эксперимента для оптимизации технологических процессов и свойств многокомпонентных систем.

Планирование эксперимента - это выбор числа опытов и условий их проведения необходимых и достаточных для решения поставленной задачи с требуемой точностью.

Эксперимент, который ставится для решений задач оптимизации, называется экстремальным. Примерами задач оптимизации являются выбор оптимального состава многокомпонентных смесей, повышение производительности действующей установки, повышение качества продукции и снижение затрат на её получение. Прежде чем планировать эксперимент необходимо сформулировать цель исследования. От точной формулировки цели зависит успех исследования. Необходимо также удостовериться, что объект исследования соответствует предъявляемым ему требованиям. В технологическом исследовании целью исследования при оптимизации процесса чаще всего является повышение выхода продукта, улучшение качества, снижение себестоимости.

Эксперимент может проводиться непосредственно на объекте или на его модели. Модель отличается от объекта не только масштабом, а иногда природой. Если модель достаточно точно описывает объект, то эксперимент на объекте может быть перенесён на модель. Для описания понятия «объект исследования» можно использовать представление о кибернетической системе, которая носит название чёрный ящик.



Стрелки справа изображают численные характеристики целей исследования и называются выходными параметрами (y) или параметрами оптимизации.

Для проведения эксперимента необходимо воздействовать на поведение чёрного ящика. Все способы воздействия обозначаются через «x» и называются входными параметрами или факторами. Каждый фактор может принимать в опыте одно из нескольких значений, и такие значения называются уровнями. Фиксированный набор уровней и факторов определяет одно из возможных состояний чёрного ящика, одновременно они являются условиями проведения одного из возможных опытов. Результаты эксперимента используются для получения математической модели объекта исследования. Использование для объекта всех возможных опытов приводит к абсурдно большим экспериментам. В связи с этим эксперименты необходимо планировать.

Задачей планирования является выбор необходимых для эксперимента опытов, методов математической обработки их результатов и принятия решений. Частный случай этой задачи - планирование экстремального эксперимента. То есть эксперимента поставленного с целью поиска оптимальных условий функционирования объекта. Таким образом, планирование экстремального эксперимента - это выбор количества и условий проведения опытов, минимально необходимых для отыскания оптимальных условий. При планировании эксперимента объект исследования должен обладать обязательными свойствами:

. управляемым

. результаты эксперимента должны быть воспроизводимыми.

Эксперимент называется воспроизводимым, если при фиксированных условиях опыта получается один и тот же выход в пределах заданной относительно небольшой ошибки эксперимента (2%-5%). Эксперимент проводят при выборе некоторых уровней для всех факторов, затем он повторяется через неравные промежутки времени. И значения параметров оптимизации сравниваются. Разброс этих параметров характеризует воспроизводимость результатов. Если он не превышает заранее заданной величины, то объект удовлетворяет требованию воспроизводимости результатов.

При планировании эксперимента активное вмешательство предполагает процесс и возможность выбора в каждом опыте тех факторов, которые представляют интерес. Экспериментальное исследование влияния входных параметров (факторов) на выходные может производиться методом пассивного или активного эксперимента. Если эксперимент сводится к получению результатов наблюдения за поведение системы при случайных изменениях входных параметров, то он называется пассивным. Если же при проведении эксперимента входные параметры изменяются по заранее заданному плану, то такой эксперимент называется активным. Объект, на котором возможен активный эксперимент, называется управляемым. На практике не существует абсолютно управляемых объектов. На реальный объект обычно действуют как управляемый, так и неуправляемый факторы. Неуправляемые факторы действуют на воспроизводимость эксперимента. Если все факторы неуправляемы, возникает задача установления связи между параметром оптимизации и факторами по результатам наблюдений или по результатам пассивного эксперимента. Возможна также плохая воспроизводимость изменения факторов во времени.

1.5 Требования, предъявляемые к факторам при планировании эксперимента


При планировании эксперимента факторы должны быть управляемыми. Это значит, что экспериментатор, выбрав нужное значение фактора, может его поддерживать постоянным в течение всего опыта, т.е. может управлять фактором. Планировать эксперимент можно только в том случае, если уровни факторов подчиняются воле экспериментатора.

Пример: Вы изучаете процесс синтеза аммиака. Колонна синтеза установлена на открытой площадке. Является ли температура воздуха фактором, который можно включить в планирование эксперимента?

Температура воздуха - фактор неуправляемый. Мы еще не научились делать погоду по заказу. А в планировании могут участвовать только те факторы, которыми можно управлять, - устанавливать и поддерживать на выбранном уровне в течение опыта или менять по заданной программе. Температурой окружающей среды в данном случае управлять невозможно. Ее можно только контролировать.

Чтобы точно определить фактор, нужно указать последовательность действий (операций), с помощью которых устанавливаются его конкретные значения (уровни). Такое определение фактора будем называть операциональным. Так, если фактором является давление в некотором аппарате, то совершенно необходимо указать, в какой точке и с помощью какого прибора оно измеряется и как оно устанавливается. Введение операционального определения обеспечивает однозначное понимание фактора.

С операциональным определением связаны выбор размерности фактора и точность его фиксирования.

Точность замера факторов должна быть возможно более высокой. Степень точности определяется диапазоном изменения факторов. При изучении процесса, который длится десятки часов, нет необходимости учитывать доли минуты, а в быстрых процессах необходимо учитывать, быть может, доли секунды.

Факторы должны быть непосредственными воздействиями на объект. Факторы должны быть однозначны. Трудно управлять фактором, который, является функцией других факторов. Но в планировании могут участвовать сложные факторы, такие, как соотношения между компонентами, их логарифмы и т.п.

При планировании эксперимента обычно одновременно изменяется несколько факторов. Поэтому очень важно сформулировать требования, которые предъявляются к совокупности факторов. Прежде всего выдвигается требование совместимости. Совместимость факторов означает, что все их комбинации осуществимы и безопасны. Это очень важное требование.

При планировании эксперимента важна независимость факторов, т.е. возможность установления фактора на любом уровне вне зависимости от уровней других факторов. Если это условие невыполнимо, то невозможно планировать эксперимент.

Таким образом, установили, что факторы - это переменные величины, соответствующие способам воздействия внешней среды на объект.

Они определяют как сам объект, так и его состояние. Требования к факторам: управляемость и однозначность.

Управлять фактором - это значит установить нужное значение и поддерживать его постоянным в течение опыта или менять по заданной программе. В этом состоит особенность «активного» эксперимента. Планировать эксперимент можно только в том случае, если уровни факторов подчиняются воле экспериментатора.

Факторы должны непосредственно воздействовать на объект исследования.

Требования к совокупности факторов: совместимость и отсутствие линейной корреляции. Выбранное множество факторов должно быть достаточно полным. Если какой-либо существенный фактор пропущен, это приведет к неправильному определению оптимальных условий или к большой ошибке опыта. Факторы могут быть количественными и качественными.


.6 Ошибки опыта


Изучение всех влияющих на исследуемый объект факторов одновременно провести невозможно, поэтому в эксперименте рассматривается их ограниченное число. Остальные активные факторы стабилизируются, т.е. устанавливаются на каких-то одинаковых для всех опытов уровнях.

Некоторые факторы не могут быть обеспечены системами стабилизации (например, погодные условия, самочувствие оператора и т.д.), другие же стабилизируются с какой-то погрешностью (например, содержание какого-либо компонента в среде зависит от ошибки при взятии навески и приготовления раствора). Учитывая также, что измерение параметра у осуществляется прибором, обладающим какой-то погрешностью, зависящей от класса точности прибора, можно прийти к выводу, что результаты повторностей одного и того же опыта ук будут приближенными и должны отличаться один от другого и от истинного значения выхода процесса. Неконтролируемое, случайное изменение и множества других влияющих на процесс факторов вызывает случайные отклонения измеряемой величины ук от ее истинного значения - ошибку опыта.

Каждый эксперимент содержит элемент неопределенности вследствие ограниченности экспериментального материала. Постановка повторных (или параллельных) опытов не дает полностью совпадающих результатов, потому что всегда существует ошибка опыта (ошибка воспроизводимости). Эту ошибку и нужно оценить по параллельным опытам. Для этого опыт воспроизводится по возможности в одинаковых условиях несколько раз и затем берется среднее арифметическое всех результатов. Среднее арифметическое у равно сумме всех n отдельных результатов, деленной на количество параллельных опытов n:



Отклонение результата любого опыта от среднего арифметического можно представить как разность y2- , где y2 - результат отдельного опыта. Наличие отклонения свидетельствует об изменчивости, вариации значений повторных опытов. Для измерения этой изменчивости чаще всего используют дисперсию.

Дисперсией называется среднее значение квадрата отклонений величины от ее среднего значения. Дисперсия обозначается s2 и выражается формулой:



где (n-1) - число степеней свободы, равное количеству опытов минус единица. Одна степень свободы использована для вычисления среднего.

Корень квадратный из дисперсии, взятый с положительным знаком, называется средним квадратическим отклонением, стандартом или квадратичной ошибкой:



Ошибка опыта является суммарной величиной, результатом многих ошибок: ошибок измерений факторов, ошибок измерений параметра оптимизации и др. Каждую из этих ошибок можно, в свою очередь, разделить на составляющие.

Все ошибки принято разделять на два класса: систематические и случайные (рисунок 1).

Систематические ошибки порождаются причинами, действующими регулярно, в определенном направлении. Чаще всего эти ошибки можно изучить и определить количественно. Систематическая ошибка - это ошибка, которая остаётся постоянно или закономерно изменяется при повторных измерениях одной и той же величины. Эти ошибки появляются вследствие неисправности приборов, неточности метода измерения, какого либо упущения экспериментатора, либо использования для вычисления неточных данных. Обнаружить систематические ошибки, а также устранить их во многих случаях нелегко. Требуется тщательный разбор методов анализа, строгая проверка всех измерительных приборов и безусловное выполнение выработанных практикой правил экспериментальных работ. Если систематические ошибки вызваны известными причинами, то их можно определить. Подобные погрешности можно устранить введением поправок.

Систематические ошибки находят, калибруя измерительные приборы и сопоставляя опытные данные с изменяющимися внешними условиями (например, при градуировке термопары по реперным точкам, при сравнении с эталонным прибором). Если систематические ошибки вызываются внешними условиями (переменной температуры, сырья и т.д.), следует компенсировать их влияние.

Случайными ошибками называются те, которые появляются нерегулярно, причины, возникновения которых неизвестны и которые невозможно учесть заранее. Случайные ошибки вызываются и объективными причинами и субъективными. Например, несовершенством приборов, их освещением, расположением, изменением температуры в процессе измерений, загрязнением реактивов, изменением электрического тока в цепи. Когда случайная ошибка больше величины погрешности прибора, необходимо многократно повторить одно и тоже измерение. Это позволяет сделать случайную ошибку сравнимой с погрешностью вносимой прибором. Если же она меньше погрешности прибора, то уменьшать её нет смысла. Такие ошибки имеют значение, которое отличается в отдельных измерениях. Т.е. их значения могут быть неодинаковыми для измерений сделанных даже в одинаковых условиях. Поскольку причины, приводящие к случайным ошибкам неодинаковы в каждом эксперименте, и не могут быть учтены, поэтому исключить случайные ошибки нельзя, можно лишь оценить их значения. При многократном определении какого-либо показателя могут встречаться результаты, которые значительно отличаются от других результатов той же серии. Они могут быть следствием грубой ошибки, которая вызвана невнимательностью экспериментатора.

Систематические и случайные ошибки состоят из множества элементарных ошибок. Для того чтобы исключать инструментальные ошибки, следует проверять приборы перед опытом, иногда в течение опыта и обязательно после опыта. Ошибки при проведении самого опыта возникают вследствие неравномерного нагрева реакционной среды, разного способа перемешивания и т.п.

При повторении опытов такие ошибки могут вызвать большой разброс экспериментальных результатов.

Очень важно исключить из экспериментальных данных грубые ошибки, так называемый брак при повторных опытах. Грубые ошибки легко обнаружить. Для выявления ошибок необходимо произвести измерения в других условиях или повторить измерения через некоторое время. Для предотвращения грубых ошибок нужно соблюдать аккуратность в записях, тщательность в работе и записи результатов эксперимента. Грубая ошибка должна быть исключена из экспериментальных данных. Для отброса ошибочных данных существуют определённые правила.

Например, используют критерий Стьюдента t (Р; f): Опыт считается бракованным, если экспериментальное значение критерия t по модулю больше табличного значения t (Р; f).



2. ПОЛУЧЕНИЕ СОВОКУПНОСТИ СЛУЧАЙНЫХ ВЕЛИЧИН.


Для ознакомления с методикой определения основных числовых характеристик совокупности случайных величин необходимо получить данную совокупность. Она может быть получена на разрывной машине (прочность, удлинение), весах (масса отрезков пряжи, полосок ткани или трикотажа), круткомере (крутка пряжи) и других приборах. Рассчитаем работу по данным из приложения А. Исходные данные представлены в таблице 1. Где - соответственно удлинение, масса и прочность образца; количество испытаний.


Таблица 1 - исходные данные для обработки результатов.

12345618359,8101392107514,8107-393119513,7101394101513,0107-395102513,9113-9816103515,610139799513,9107-39888512,295981996511,6881625610117515,2120-1625610200133,710400728Среднее значение102013,2104-132,4

2.1 Расчёт оценок математического ожидания, дисперсии и среднеквадратического отклонения


Математическое ожидание ? (среднее значение) определяет центр распределения случайных величин, около которого группируется большая их часть. Абсолютными характеристиками рассеяния случайной величины Y около центра распределения ? является дисперсия S2 {Y} и среднее квадратическое отклонение S{Y}.

Расчет оценок математического ожидания, дисперсии и среднего квадратического отклонения для анализируемой выборки осуществляется по следующим формулам:



2.2 Исключение резко выделяющихся экспериментальных даннях


Совокупность полученных экспериментальных данных часто имеет значения, резко выделяющиеся относительно других, что приводит к постановке вопроса об их исключении из дальнейшей обработки. Причиной появления таких данных может быть изменение условий проведения опыта в момент наблюдения, ошибочная регистрация параметра (по вине оператора) и т.п. Независимо от причин получения резко выделяющихся данных они могут существенно исказить числовые характеристики. С другой стороны, при необоснованном исключении таких данных числовые характеристики также будут искажены.

Самый надежный метод определения возможности исключения резко выделяющихся данных - это анализ условий, при которых они были получены. Если условия существенно отличаются от стандартных (или установленных по плану эксперимента), то данные необходимо исключить из дальнейшей обработки независимо от их величины. Если определение существенности изменения условий эксперимента невозможно или представляет большие трудности, то используют статистический метод исключения данных, сущность которого заключается в следующем:

находят в совокупности максимальную и минимальную величины и определяют расчетные значения критерия Смирнова-Граббса:



сравниваем полученные значения с табличным VТ , если VR max или VR min больше VТ, то соответствующее значение Yi необходимо исключить из совокупности Таким образом полученные значения не исключаем.


2.2 Расчет относительных характеристик рассеяния случайной величины


Относительной характеристикой рассеяния случайной величины является коэффициент вариации СV{Y}:



Если данная величина выражается в процентах, то она называется квадратической неровнотой C{Y}:



2.4 Определение ошибки среднего и границ доверительного интервала


В результате измерений исследуемого параметра возникают ошибки (погрешности измерения), для описания которых введена оценка абсолютной ?i, погрешности. Абсолютная и относительная доверительные ошибки, допущенные при оценке математического ожидания, определяются по формулам:


где


Двусторонним доверительным интервалом называется интервал, который покрывает неизвестный параметр распределения с заданной доверительной вероятностью РD:



В практике текстильных исследований при статистической обработке обычно принимают РD = 0,95 . Величина, равная ? = 1?РD, называется уровнем значимости и иногда выражается в процентах.


.5 Доверительный объем испытаний


Анализируя точность оценки среднего значения, можно решить, является ли она достаточной или требуется увеличение объема измерений. Задаваясь требуемой величиной относительной ошибки (например, ? = 3%) и приняв квадратическую неровноту по данным предыдущих опытов или другой априорной информации, можно рассчитать доверительный объем выборки:



где u{PD} ? квантиль нормального распределения случайной величины (при РD = 0,954 и u{РD} = 2).



3. ПОСТРОЕНИЕ ГИСТОГРАММЫ И ПОЛИГОНА ИМПЕРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ.


Исходные данные представлены в таблице 1.


Таблица 1 - Исходные данные для расчёта на примере измерений высоты початка кукурузы от земли.

№ п/пЗначение№ п/пЗначение№ п/пЗначение№ п/пЗначение№ п/пЗначение12345678910167215541746179815928022544277627282813802360431006388839346824634410364898490569257845696594857967426874672668286837722794477467808791869289148666881888798029884967697789891079309050727080909411903179517271799192121093284526872789291139933845380738393761234567891014100341085481749294791511535835584759395731668368456777681968417703799577977829779187238985881788698841973391025984798999792070401016076809310084

Определим размах варьирования результатов измерения по следующему выражению:



где R-размах варьирования в , см.

Хmax,min-максимальное и минимальное значение высоты прикреплённого початка.


R= 115-54=61 см.


Определяем интервал групп из значения:



Где K- число групп ( К)



Далее построим таблицу 2 и в ней произведём дальнейший расчёт.


Таблица 2 -Расчёт квадратов суммы отклонений.

ИнтервалЧастота Среднее значение по группе 123456754-61,7457,85231,424,4497,762389,2562,7-70,41266,55798,615,711892961,6571,4-79,12775,252031,757,01189,271326,7880,1-87,82983,952434,55-1,69-49,0182,8288,8-96,51692,651482,4-10,39-166,241727,2397,5-105,29101,35912,15-19,09-171,813279,85106,2-113,92110,05220,1-27,79-55,581544,57114,9-1151114,95114,95-32,69-32,691068,63Итог1008225,90,714380,78

Находим текущее значение высоты прикрепления початка, в см.



Определяем среднеквадратическое отклонение из выражения:



где S- стандартное отклонение, X и Xi- текущее и среднее значение высоты прикрепления початка, см, n-объём выборки.

Подставив данные из таблицы 2 в выражение (3) получим:



Определяем ошибку выборочной средней из выражения:



Из выражения (4) находим:



Определяем коэффициент вариации:


Находим относительную ошибку по формуле:



Построение гистограммы и полигона и эмпирического распределения.

Гистограмма представлена на рисунке 1.


Рисунок 1- Гистограмма и полигон эмпирического распределения.



4. ПРОВЕРКА ОСНОВНОЙ ГИПОТЕЗЫ


Исходные данные для расчёта представлены в таблице 3.


Таблица 3 - Исходные данные к расчёту критерий Пирсона

Интервал группировкиФактическая частотаТеоретические значения fpi попадающий в соответствующий интервал123454-61,743,50,2862,7-70,41211,0971,4-79,12721,3380,1-87,82924,4788,8-96,51613,5697,5-105,297,51106,2-113,921,95 0,28114,9-11510,01Итог100

Основной называют гипотезу об отсутствии реального различия между двумя сравниваемыми вариационными рядами: эмпирическим и теоретическим или двумя эмпирическими.

Для оценки соответствия эмпирического распределения теоретическому используют критерий согласия (подобия) , закон распределения которого открыл К. Пирсон. Кривая распределения, полученная из функции имеет вид: , где -фактическая частота численности объектов выборки; F- гипотетическая (теоретическая) частота объектов выборки).

Гипотеза опровергается, если и не опровергается, если .

Фактическая частота численности объектов в определённой части известна из эмпирического распределения. Гипотеза о нормальном характере распределения частот позволяет вычислить теоретические их значения для вероятности Pi попасть в i-интервал.

Для этого используют следующие выражение



где - концы рассматриваемого интервала; и S- параметры распределения, среднее и стандартное отклонение соответственно.

В третьей графе приведены теоретические значения , попадающие в соответствующий интервал. Вероятности вычислим в предложении что генеральная совокупность имеет нормальное распределение с параметрами X=82,26 см и S= 12,05 см. Вероятность определяем по формуле (5). Значение функции Лапласа Ф(Хi) принимаем по таблице 4 из приложения.

Тогда




Для того чтобы соблюсти условие , объединим в один 1,7,8 интервалы.

В этом случае после подстановки конкретных значений в выражение



Получим,



Для второго интервала:


Для третьего интервала:



Для четвёртого интервала:



Для пятого интервала:



Для шестого интервала:



Суммируем все значения и определяем



При числе степеней свободы , имеем и табличное значение критерия Пирсона (см. таблицу 3 приложения).

Отсюда


Следовательно, по критерию Пирсона следует отклонить основную гипотезу.


5. ТОЧЕЧНАЯ И ИНТЕРВАЛЬНАЯ ОЦЕНКА. СРАВНЕНИЕ ДВУХ ВЫБОРОК


Статические характеристики выборочной совокупности являются приближёнными оценками независимых параметров генеральной совокупности. Оценка может быть представлена одним числом, точкой (точечная оценка) или некоторым интервалом (интервальная оценка), в которой с определённой вероятностью может находиться искомый параметр.

Обозначив ошибку выборочной средней как S, точечную оценку генеральной средней можно записать в виде .

Интервальной называют оценку, которая характеризуется двумя числами - концами интервала, покрывающего оцениваемый параметр. Доверительным называют такой интервал, который с заданной вероятностью покрывает оцениваемый параметр. Центр такого интервала - выборочная оценка точки, а пределы, или доверительные границы интервала определяются средней ошибкой и уровнем вероятности. Интервальная оценка является дальнейшим развитием точечной оценки.

В общем виде доверительный интервал для генеральной средней записывается как



или в более краткой форме


.


Здесь - предельная ошибка выборочной средней при данном числе степеней свободы и принятом уровнем значимости, а - критерий Стьюдента при выбранном уровне зависимости и числе степеней свободы.

Исходные данные для расчёта представлены в таблице 4.

Таблица 4 - исходные данные

nXSxn1;2X1Sx1X2Sx2611,8%0,40%13170,6190,8

Пример №1: при числе степеней свободы равном n-1=3-1=2 имеем t05=4,30 и t01=9,93.

Найдём доверительные интервалы 95%-ный и 99%-ный


.


Такая запись говорит о том, что с вероятностью 95% генеральная средняя содержания белка в зерне заключена в интервале с вероятностью 99% она находиться в интервале . Вероятность выйти за эти интервалы в первом случае составляет 5%, а во втором -1%(уровень значимости).

Крайние точки начало и конец называют доверительными границами.

Интервальную оценку параметров распределения можно использовать для статической проверки гипотез при сравнении выборочных средних.

Пример №2: пусть, например, при числе повторностей

полученные средние их ошибки .

Необходимо определить, существенно ли различаются эти выборочные средние при 95%-ном уровне вероятности или 5%-ном уровне значимости т.е проверить нулевую гипотезу Н0: . Для 11-1=10 степеней свободы имеем и 95%-ные доверительные интервалы равны:



Доверительные интервалы для генеральных средних перекрывают друг друга и следовательно, разность между выборочными средними нельзя переносить на генеральные средние , так как она может быть равна нулю. Поэтому нулевая гипотеза не отвергается.

Величину, указывающую границу случайным предельным отклонением называют наименьшей существенной разностью. Её сокращённо обозначают НСР и определяют по отношению



Здесь t определяется при степеней свободы.

- ошибка разности средних. В теории статически доказывается, что ошибка разности или суммы независимых средних арифметических выборок при одинаковом числе наблюдений определяется соотношением



Если фактическая разность между выборочными средними больше НСР


,


то гипотеза об отсутствии разницы отвергается и доказывается существенность разности.

Если выполняется условие



То нулевая гипотеза не отвергается и разность между выборочными средними статически не доказывается.

Для рассмотренного выше примера имеем:



При степеней свободы критерий Стьюдента при 5% ном и 1% ном уровнях значимости соответственно равны


Отсюда


Величину НСР определяем из выражения (9)



Следовательно, разность между средними при 5%ном уровне значимости по условию (11) гипотеза об отсутствии разницы отвергается, а при 1%ном уровне значимости не существенна.

Другим способом оценки существенности различий между Х1 и Х2 служит отношение разности к её ошибке. Это отношение получило название критерия существенности разности.



Если , то различия находятся в пределах случайных колебаний(различия между средними не доказывается), а если - нулевая гипотеза опровергается.

В нашем случае



Таким образом имеем и

Следовательно, разность между Х1 и Х2 находится в пределах случайных колебаний для 5%ного уровня значимости, а для 1%ного уровня значимости она не существенна.




6. ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ.


Исходные данные представлены в таблице 5.


Таблица 5 - исходные данные для расчёта.

№ вариантаМарка комбайнаДробление зерна в % повторностей2СК-5М171199ДОН 15005735

Сущность дисперсного анализа является расчленение общей суммы квадратов отклонений и общего числа степеней свободы на части - компоненты, соответствующая структуре эксперимента и оценка значимости действия и взаимодействия изучаемых факторов по F - критерию.

Дисперсия - это частное от деления суммы квадратов отклонений текущих значений от среднего на число степеней свободы. Число степеней свободы каждой дисперсии равно количеству всех измерений без единицы ( на каждую дисперсию наложена одна связь).

Для определения суммы квадратов отклонений используется следующие выражение



Вторая часть этой формулы сильно облегчает работу по вычислению дисперсии с многозначными членами.

Расчёт проведём для однофакторного опыта, в котором сравниваются два варианта. Общее число которых равно восьми - по четыре в каждом варианте.

Пример 1. Было определенно дробление зерна кукурузы при уборке её комбайнами СК-5М1 «Нива» и ДОН-1500, соответственно с кукурузоуборочными приставками ППК-4 и КДМ-8. Независимость выборок обеспечивалась отбором проб в случайном порядке.

Полученные опытные данные представлены в таблице 6.


Таблица 6 - Дробление зерна кукурузы.

ВариантыДробление, %Сумма по вариантам, VСреднее по вариантамСК-5М17,11,9,9369ДОН 15005,7,3,5205Общая сумма Общие среднее Х=7

В этом эксперименте возможна лишь одна группировка исходных дат- по вариантам. Находим суммы и средние по вариантам, общую сумму и общую среднюю по опыту. Варьирование дробления, то есть отклонение его общей средней обусловлена здесь двумя компонентами - эффектами вариантов и случайным варьированием. Других источников вариации дробления зерна в опыте нет.

Следовательно, общие варьирование CY, которое измеряется суммой квадратов отклонений дробления от общей средней состоит из варьирования вариантов Сv и случайного варьирования Сz.

Модель дисперсионного анализа данных этого опыта имеет вид



Определяем общую сумму квадратов отклонений



По формуле (16) определим


Эту же величину мы получим, если воспользуемся правой частью выражения (14)



Второй член этого выражения носит название корректирующего фактора С.

Следовательно выражение (17) примет вид



Подставим полученные данные в выражение (18)



Общие число степеней свободы для этой группировки составляет



Для определения суммы квадратов отклонений по вариантов вместо каждой даты Х в таблицу 6 подставим среднее соответствующие вариантов.


Таблица 7 - Дробление зерна кукурузы.

ВариантыДробление, %Сумма по вариантам, VСреднее по вариантамСК-5М19,9,9,9369ДОН 15005,5,5,5.205Общая сумма Общие среднее Х=7Подставляя вместо фактических данных Х средние по вариантам ХV, мы тем самым устраняем случайную вариацию внутри вариантов выборки.

Сумму квадратов отклонений для вариантов находим по соотношению



Подставим и получим


.


Это же самое можно найти и менее громоздким способом, минуя вычисления средних. Для этого достаточно использовать выражение



Отсюда



Разность между общим варьированием и варьированием вариантов даёт сумму квадратов отклонений для ошибки



Общие число степеней свободы также расчленяется на две части:

Степени свободы для вариантов



Степени свободы для ошибки



Для вычисления фактического критерия существенности находим два средних квадрата (дисперсии).


Для вариантов


Для ошибки



Определяем критерий существенности



Сравним полученное значение с табличным при 5%ном уровне значимости для одной степени свободы вариантов (числитель) и шести степеней свободы ошибки (знаменатель)



Следовательно, варианты в опыте различаются существенно, и таким образом, нулевая гипотеза отвергается.

Определяем наименьшую существенную разность для 5%-ного уровня значимости.



Теоретическое значение критерия Стьюдента



Следовательно



Таким образом, комбайн ДОН-1500 дробит зерно существенно меньше, чем комбайн СК-5М-1.


7. ТРЁХФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ


Исходные данные приведены в таблице 8.


Таблица 8 - Степень очистки початков и их листьев.

ФакторыСтепень очистки початков, %АВСВариант №23 км/ч230700 мин-139,145,531,4900 мин-152,655,551,1430700 мин-151,656,855,9900 мин-146,948,048,79 км/ч230700 мин-133,231,231,3900 мин-158,453,056,1430700 мин-142,847,143,4900 мин-160,154,560,0

Многофакторный дисперсионный комплекс - это совокупность исходных наблюдений (дат), позволяющих статически оценить действие и взаимодействие нескольких изучаемых факторов на изменчивость результативного признака.

Статическую обработку данных в этом случае проводят в следующей последовательности:

Заносят исходные данные в таблицу, определяют сумму и средние.

Вычисляют суммы квадратов для общего варьирования CY, варьирование повторений Cp, вариантов Cv, и остатка Cz, т.е обрабатывают данные, так же как и результаты однофакторного опыта.

Общие варьирование вариантов Cv, разлагают на компоненты - главные эффекты изучаемых факторов и их взаимодействия.

Составляют таблицу дисперсионного анализа и проверяют нулевую гипотезу о существенности действий и взаимодействия факторов по F- критерию.

В таблице 9 определяем суммы и средние.


Таблица 9 - Влияние изучаемых факторов на степень очистки початков и обёрточных листьев, %

ФакторыСтепень очистки початков, %Суммы VСредние АВСПовторения3 км/ч230700 мин-139,145,531,411638,7900 мин-152,655,551,1159,253,1430700 мин-151,656,855,9164,354,8900 мин-146,948,048,7143,647,99 км/ч230700 мин-133,231,231,395,731,9900 мин-158,453,056,1167,555,8430700 мин-142,847,143,4133,344,4900 мин-160,154,560,0174,658,2Суммы P384,7391,6377,91154,2X=48,1

Правильность вычисления проверим по соотношению



Далее рассчитываем суммы квадратов отклонений



Число степеней свободы



Корректирующий фактор


Общая сумма квадратов



Число степеней свободы

Сумма квадратов для повторений



Число степеней свободы .

Суммы квадратов для вариантов



Число степеней свободы

Сумма квадратов отклонений для остатка



Число степеней свободы 23-(2+3)=14.

Следующий этап - определение сумм квадратов АВ, АС, ВС, АВС. Для этого на основании таблицы 10 составим вспомогательную таблицу 11, в которую из таблицы 9 выпишем суммы по вариантам и определим суммы сумм для главных эффектов и взаимодействий, исключая действия разных факторов.


Суммы по вариантамСуммы сумм по факторам и взаимодействиямАВСАВАВАСВС0100Х1Х2А0 Х1+Х2+ +Х3+Х4В0 Х1+Х2+ +Х5+Х6А0В0 Х1+Х2А0С0 Х1+Х3В0С0 Х1+Х51Х3Х4А0В1 Х3+Х4А0С1 Х2+Х4В0С0 Х2+Х610Х5Х6А1 Х5+Х6+ +Х7+Х8В1 Х3+Х4+ +Х7+Х8А1В0 Х5+Х6А1С0 Х5+Х7В1С0 Х3+Х71Х7Х8А1В1 Х7+Х8А1С1 Х6+Х8В1С1 Х4+Х8Суммы сумм СС0 Х1+Х3 +Х5+Х7С1 Х2+Х4 +Х6+Х8----- (проверка)С0+С1А0+А1В0+В1А0В0+А0В1 +А1В0+А1В1А0С0+А0С1 +А1С0+А1С1А0В0+А0В1 +А1В0+А1В1Таблица 9 - расчётные формулы для определения главных эффектов и взаимодействий


Таблица 10 - Определение главных эффектов и взаимодействий

Суммы по вариантамСуммы сумм по факторам и взаимодействиямАВСАВАВАСВС0100103,2162,1А0 587,9В0 539,6А0В0 265,3А0С0 275В0С0 202,61171,8150,8А0В1 322,6А0С1 312,9В0С0 3371099,4174,9А1 592,3В1 640,6А1В0 274,3А1С0 239В1С0 311,41139,6178,4А1В1 318А1С1 353,3В1С1 329,2Суммы сумм СС0 514С1 666,2----- (проверка)С0+С1 1180,2А0+А1 1180,2В0+В1 1180,21180,21180,21180,2

Вычисляем суммы квадратов отклонений для факторов А, В, С (главных эффектов) и парных взаимодействий АВ, АС, ВС.



при степеней свободы.



при степеней свободы.



при степеней свободы.


при степеней свободы.



при степеней свободы.


при степеней свободы.


при одной степени свободы.

Теоретическое значение F-критерия при 5%-ном уровне значимости, одной степени свободы для главных эффектов и взаимодействий, 14 степеней свободы для остатка (ошибки) равно 4,60.

Результаты расчётов сводим в таблицу 11.



Таблица 11 Результаты дисперсионного анализа

ДисперсияСумма квадратовСтепени свободыСредний квадратFФF05Общая23---Повторений2---Скорости А0,8110,814,60Угла В42514254,60Частоты вращения С965,21965,24,60Взаимодействие АВ7,7517,754,60Взаимодействие АС243,21243,24,60Взаимодействие ВС566,51566,54,60Взаимодействие АВС77,75177,754,60Остаток (ошибка)91,92146,5--

Определим наименьшую существенную разность. Значений t-критерия при 5%-ном уровне значимости и 14 степенях свободы ошибки составит 2,15 (таблица 1 приложения)

Для частных различий



Для главных эффектов




Для парных взаимодействий



Из сравнения дисперсий следует (по таблице 4 при условии , что существенно влияют на степень очистки початков: угол наклона русел; частота вращения вальцов; взаимодействие скорости и частоты, угла и частоты.

Влияние факторов



Влияние повторений



Влияние случайных факторов

8. КОРРЕЛЯЦИОННЫЙ И РЕГРЕССИОННЫЙ АНАЛИЗ


Под линейной (прямолинейной) корреляционной зависимостью между двумя признаками X и Y понимают такую зависимость, которая носит линейный характер и выражается уравнением прямой линии Y=a+bX.

Это уравнение называется уравнением регрессии X и Y, а соответствующая ему прямая линия - выборочной линией регрессии X на Y.

Исходные данные представлены в таблице 12.


Таблица 12 - Исходные данные

№ парыПример №1Пример №2Относительная Влажность почвы Х, %Липкость почвы Y, г/см3Концентрация Аммиака Х, кг На 100 м3Потери Y, %114,814 526 24215,71,6321,12,17 716 15424,42,2525,52,79 1013 12635,32,7739,83,618 19 186 8 8842,74,4950,65,21053,36,826 28 416 4 31159,27,31271,68,3

Коэффициент корреляции определяется по выражению



Вычислим вспомогательные величины. При расчёте учтём, что число пар наблюдений n=12.

Для удобства расчётов занесём в таблицу 13 значение Х2.

Таблица 13 - К расчёту корреляции и регрессии Y по X

Номер парыЗначение признаковХ2. Y2XYХ,%Y,%114,81219,04114,8215,71,6246,492,5625,12321,12,1445,214,4144,31424,42,2595,364,8453,68525,52,7650,257,2968,85635,32,71246,097,2995,31739,83,61584,0412,96143,28842,74,41823,2919,36187,88950,65,22560,3627,04263,121053,36,82840,8946,24362,441159,27,33504,6453,29432,161271,68,35126,5668,89594,28Сумма45447,920842,22255,172285,23


Подставим полученные данные в выражение (46) и получим



Коэффициент регрессии определим по выражению


Уравнение регрессии в каноническом виде имеет вид


Отсюда


Стандартную ошибку коэффициента корреляции определяем по формуле:



Ошибку коэффициента регрессии найдём по выражению



Ошибка отклонения регрессии определяется по формуле



Критерий значимости рассчитывается по выражению



Количество степеней свободы составит



Критерий Стьюдента при 5 % -ном уровне значимости в этом случае составит t05=2,23.

Доверительный интервал для коэффициента корреляции



Доверительный интервал для коэффициента регрессии



Так как , то корреляционная связь существенна.

По уравнению регрессии (50) рассчитываем усреднённые теоретические значения (минимум и максимум), подставляя в уравнение координаты X=19,9 и Х=76,6.


График регрессии показывает, что увеличение влажности почвы на 1 % соответствует увеличению липкости в среднем на 0,13 г/см2 .

Коэффициент детерминации, равен квадрату коэффициента корреляции


.


Судя по коэффициенту детерминации, примерно 95 % изменений липкости обусловлено изменениями по влажности почвы и только 5% связано с другими факторами.

Чтобы ограничить доверительную зону необходимо вверх и вниз от теоретической линии регрессии отклонить величину одной (68%-ая зона) или (98%-ая зона) ошибок отклонений от регрессии Syx , то есть ± Syx или 2Syx и провести пунктирные линии.

Есть связь изучаемыми явлениями существенно отклоняется от линейной, что легко установить по виду корреляционной решётки или по точечному графику, то коэффициент корреляции непригоден в качестве меры связи. Он может указать на отсутствие сопряженности там, где на лицо сильная криволинейная зависимость. Поэтому необходим такой показатель, который измерял бы степень криволинейной зависимости. Таким показателем является корреляционное отношение, обозначенное греческой буквой (эта).

В таблице 14 приведены исходные данные для расчета разобьём на группы, чтобы в каждой группе независимого признака Х было не менее двух наблюдений. Также составим вспомогательную таблицу 15 и вычислим суммы квадратов отклонений и средние.


Таблица 14 - Потери аммиака от испарения в зависимости от концентрации его в поливной воде

Номер парыКонцентрация аммиака в поливной воде Х, кг на 100 м3Потери Y, %Группа1 24 526 2413 47 716 1525 69 1013 1237 8 918 19 186 8 8410 11 1226 28 416 4 35

Построим вспомогательную таблицу 15


Таблица 15 - Вспомогательная таблица к расчёту корреляционного отношения.

№ парыХГрупповая Средняя ХfnxYГрупповая Средняя YxY-YxY-Ycp(Y-Ycp)21 24 54,5226 24251 -11 114,25 12,25203,06 150,063 47 77216 1515,50,5 -0,50,25 0,254,25 3,2518,06 10,565 69 109,5213 1212,50,5 -0,50,25 0,251,25 0,251,56 0,067 8 918 19 1818,6736 8 87,33-1,33 0,67 0,671,76 0,44 0,44-5,75 -3,75 -3,7533,06 14,06 14,0610 11 1226 28 4131,6736 4 34,331,67 -0,33 -1,332,78 0,10 1,76-5,75 -7,75 -8,7533,06 60,06 76,56-19214,271214111,750,0210,280614,22


Определим квадрат корреляционного отношения



Корреляционное отношение найдём по выражению



Ошибку корреляционного отношения определим по формуле



Определяем критерий существенности корреляционного отношения


При числе степеней свободы табличное значение критерия Стьюдента составит 2,23

Так как , то нулевая гипотеза отклоняется и считается доказанным наличие криволинейной зависимости.

Доверительный интервал для корреляционного отношения



9. СПОСОБ ОБРАБОТКИ ЭМПИРИЧЕСКИХ ДАННЫХ


Первоначально данные исследований представляют в виде таблиц. Однако табличные данные не имеют наглядности и не могут быть использованы в математических моделях, описывающих тот или иной процесс. Указанных недостатков лишены эмпирические формулы, отражающие с определённым уровнем достоверности зависимость между изучаемыми величинами. Этот процесс называется аппроксимацией. При аппроксимации опытных данных, прежде всего, наносят на координатную сетку опытные данные и затем через полученные точки проводят кривую таким образом, чтобы она по возможности близко проходила от всех экспериментальных точек. Таким образом, первый этап математической обработки данных состоит в выборе формулы, графическое изображение которой согласуется в общих чертах с размещением экспериментальных точек на координатной сетке. Задачей дальнейшей математической обработки является определение числовых значений, входящих в формулу параметров. В большинстве случаев зависимость между переменными можно задать множеством эмпирических формул, и только глубокое значение физической сущности изучаемого процесса позволяет остановиться на одной из них.

Метод подбора числовых значений, входящих в формулу параметров основан на принципе наименьших квадратов, суть которого состоит в том, что из множества возможных эмпирических зависимостей выбирается та, для которой сумма квадратов отклонений, замеряется по оси является наименьшей.

Впервые этот метод предложил Гаусс. Рассмотрим применение этого метода для эмпирических формул, описывающие различные формы зависимостей.

Исходные данные для расчётов приведены в таблице 16


Таблица 16 - исходные данные для исследования

№ ВарНаработка Хi тыс. мото часовИзнос Yj, мм123456781234567880,30,91,52,12,73,33,94,50,050,080,170,210,270,370,40,42

Линейная функция.

Пусть дано n точек с координатами представляющих данные эксперимента - таблица 17.

Очевидно, что эмпирическую формулу нужно искать в виде линейной функции.

Причём коэффициенты a и b нужно подбирать так, чтобы суммарное отклонение принимало минимальное значение.


Таблица 17 - Износ коренных шеек коленчатого вала двигатель Д 240 от наработки.

iНаработка хi тыс. мото - часИзнос yi ммХi2Хi* yi10,30,050,090,01520,90,080,810,07231,50,172,250,25542,10,214,410,44152,70,277,290,72963,30,3710,891,22173,90,4015,211,5684,50,4220,251,8919,21,9761,176,183

Составим систему уравнений и найдём значения.


В формулу (59) подставим значения из таблицы 17 и получим



В результате расчётов имеем



Таким образом, эмпирическое уравнение линейной функции имеет вид



Квадратичная функция.

Эмпирическую формулу нужно искать в виде квадратичной функции



Составим таблицу 18 для упрощения расчётов.


Таблица 18 - Экспериментальные данные в общем виде

iXi10,30,090,0270,00810,050,0150,004520,90,810,7290,65610,080,0720,064831,52,253,3755,06250,170,2550,382542,14,419,26119,44810,210,4410,926152,77,2919,68353,14420,270,7291,968363,310,8935,937118,59210,371,2214,029373,915,2159,319231,34410,401,566,08484,520,2591,125410,06250,421,898,50519,261,17219,456838,31771,976,18321,9645


Составим систему уравнений



В систему (61) подставим, значения из таблицы 18 получим,



В результате решения данной системы найдём значения a,b,c.



Гиперболическая функция

Уравнение гиперболы функции выглядит так



Составим систему уравнений



При вычислении коэффициента данные удобно свести в таблицу 19.


Таблица 19 - Экспериментальные данные для обработки.

i10,30,0520,90,0831,50,1742,10,2152,70,2763,30,3773,90,4084,50,4219,21,97

Подставим значения из таблицы 19, в формулу 63 получим



Численные значения параметров а и b найдём путём решения системы уравнения (64).

В результате решения системы получили

Подставив эти значения, в уравнение гиперболы получим



Показательная функция

Данные опыта могут быть апроксимированы показательной кривой

Для получения параметров прологарифмируем обе части функции. При этом учтём, что логарифм произведения равен сумме логарифмов сомножителей, а логарифм её степени равен произведению показателя на логарифм её основания. Затем следует найти величины

Получим систему логарифмических уравнений



Для решения системы удобно составить таблицу 20.


10,30,090,05-2,99-0,89720,90,810,08-2,52-2,26831,52,250,17-1,77-2,65542,14,410,21-1,56-3,27652,77,290,27-1,30-3,5163,310,890,37-0,99-3,26773,915,210,40-0,91-3,54984,520,250,42-0,86-3,8719,261,171,97-12,6-23,292математическое планирование эксперимент дисперсия

В результате решения этой системы получили



СПИСОК ЛИТЕРАТУРЫ


1.Подобие и моделирование

Седов Л.И. Методы подобия и размерности в механике.-М.:Наука, 1981.-448 с.

Веников В.А., Веников Г.В. Теория подобия и моделирование/применительно к задачам электроэнергетики/.-М.:Наука,1984.-439 с.

.Планирование эксперимента

Планированиеэксперимента в технике / В.И.Барабащук, Б.П.Креденцер, В.И.Мирошниченко; под. ред.. Б.П.Креденцера.-К.:Техніка 1984.-200с.

Адлер Ю.П., Маркова Е.В., Грановский Ю.В. Планирование эксперимента при поиске оптимальных условий.-М.:Наука,1971.-283с.

Ахназарова С.Л., Кафаров В.В. Методы оптимизации в химической технологии .-М.Высшая школа, 1985.-325 с.

.Статистическая обработка результатов эксперимента

Вентцель Е.С. Теория вероятностей,-М.Наука,1969.-576 с.

Вентцель Е.С., Овчаров Л.А. Теория вероятностей и ее инженерные приложения.-М.:Наука.-1988.- 480 с.

Коваленко И.Н., Филиппова А.А. Теория вероятностей и математическая статистика.-М., Высшая школа, 1973.-368 с.

Базара М.,Шетти К. Нелинейное программирование. Теория и алгоритмы.-М.,Мир.-1982.-583 с.

Колкер Я.Д. Математический анализ точности механической обработки деталей.-Киев, Техника.-1976.-200с.



ОГЛАВЛЕНИЕ ВВЕДЕНИЕ 1.ОСНОВЫ МАТЕМАТИЧЕСКОГО ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА 1.1 История возникновения планирования эксперимента 1.2 Основные понятия

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ