Исследование ряда погрешностей на соответствие нормальному закону распределения

 
















Исследование ряда погрешностей на соответствие нормальному закону распределения


1. Теоретические основы выполнения исследований


Обработка результатов измерений имеет место всегда, когда одна из определяемых величин получена несколько раз с отличными друг от друга значениями. При этом корректная оценка полученных результатов возможна, только если известны правила, определяющие поведение погрешностей измерений ?. К главным таким правилам относят законы поведения погрешностей в дифференциальной F(?) и интегральной F (?) формах, их основные численные характеристики и представления законов в виде графического материала. Интегральная форма называется функцией распределения погрешностей , дифференциальная форма - функцией плотности распределения погрешностей . К основным характеристикам законов относят наиболее вероятное значение определяемой величины, называемое математическим ожиданием и обозначаемое МО (?) или М(?), или Е(?); меру рассеивания измерений вокруг математического ожидания, называемую дисперсией и D(?) (чаще используют просто величину ?(?), называемую стандартом, так как он не имеет квадратичной размерности как у дисперсии). К дополнительным характеристикам законов относят меру скошенности относительно вертикальной оси симметрии, называемую асимметрией и обозначаемую А или и меру крутости, называемую эксцессом и обозначаемую Е.

Множество теоретических и практических исследований показывают, что результаты геодезических измерений подчиняются нормальному закону распределения (закону Гаусса) и имеют вид



В процессе измерений часто имеет место наличие грубых погрешностей (погрешностей, больших заданного допуска) или промахов (т.е. очень сильно отличающихся от других). С другой стороны, при наблюдениях в результатах могут содержаться и какие-либо постоянные составляющие, называемые систематическими ошибками.


2. Предварительные вычисления для исследования


В предварительных вычислениях ряд исследуется на наличие значимых систематических и грубых погрешностей а также меры однородности результатов по точности на основе каких-либо критериев.

Определение значимости систематического влияния. Следует иметь ввиду, что систематические влияния в рядах присутствуют всегда, но они могут быть значимы и не значимы. При определении наличия значимых систематических погрешностей в ряде имеют место два случая:

1) известно истинное значение определяемой величины Хист и произведено ее измерений х. В этом случае пользуются зависимостью



Где ?=X- =- средняя квадратическая погрешность среднего арифметического, m-СКП одной величины, n - число элементов в ряде. Величина (квантиль t-распределения Стьюдента) определяется по уровню значимости q (или вероятности р) и числу избыточных измерений (числу степеней свободы) k = n - 1 и выбирается из статистических таблиц, или получается из какого либо программного продукта. Если неравенство (2) выполняется, то с вероятностью р = 1 - q считаем, что значимые систематические погрешности в ряде измерений отсутствуют.


Аббе1-0,06-0,040,000,000,00-1,963,842-2,02-1,993,98-7,9415,831,041,083-0,98-0,950,91-0,870,831,592,5440,610,640,410,260,17-0,670,455-0,05-0,030,000,000,00-1,061,136-1,12-1,091,19-1,301,420,490,247-0,63-0,600,36-0,210,130,880,7780,250,280,080,020,01-1,241,549-0,99-0,970,93-0,900,871,973,87100,981,001,001,011,01-1,622,6111-0,64-0,610,38-0,230,142,456,00121,811,843,376,1911,37-2,898,3513-1,08-1,051,11-1,171,231,281,64140,200,230,050,010,00-1,722,9615-1,52-1,492,23-3,334,980,800,6416-0,72-0,700,48-0,340,230,130,0217-0,59-0,570,32-0,180,100,990,99180,400,430,180,080,030,540,29190,940,970,940,910,88-0,640,41200,300,330,110,040,01-0,670,4521-0,37-0,350,12-0,040,011,191,41220,820,840,710,600,50-0,020,00230,800,830,680,560,47-0,680,46240,120,150,020,000,000,450,20250,570,600,360,210,13-0,160,03260,410,440,190,090,04-1,401,9627-0,99-0,960,92-0,880,851,753,05280,760,790,620,490,38-1,422,0129-0,66-0,630,40-0,250,160,050,0030-0,60-0,580,33-0,190,110,780,61310,180,200,040,010,00-0,480,2332-0,31-0,280,08-0,020,010,180,0333-0,13-0,100,010,000,000,730,53340,600,620,390,240,150,450,20351,051,071,151,241,33-1,241,5536-0,20-0,170,030,000,000,530,28370,330,360,130,040,02-0,570,3238-0,24-0,210,04-0,010,000,470,22390,230,260,070,020,000,210,04400,440,470,220,100,05-1,061,1241-0,62-0,590,35-0,200,120,890,80420,270,300,090,030,010,330,11430,600,630,390,250,16-0,510,26440,090,120,010,000,001,642,68451,731,763,095,439,53-2,345,4746-0,61-0,580,34-0,200,11-0,130,0247-0,74-0,710,50-0,360,25-1,011,0348-1,75-1,722,97-5,118,802,667,08490,910,940,880,820,77-0,040,00500,870,890,800,720,64

2) Исследование на наличие существенного систематического влияния по критерию Аббе. Истинное значение величины не известно. Тогда наличие в результатах наблюдений постоянной составляющей может быть выяснено по наиболее распространенному в геодезии критерию Аббе [2 и др.]. Для этого выдвигаем гипотезу, что с вероятностью ? в предложенном ряде отсутствует значимое систематическое влияние. По исследуемым величинам получаем практическую величину



являющуюся отношением двух оценок дисперсий, средние квадратические ошибки которых получены как



где уклонение i - той величины от среднего

последовательные разности

Для сравнения, по заданной вероятности ? (или уровню значимости q), числу степеней свободы п и с использованием статистических таблиц критерия Аббе получают контрольную величину . Тогда, при ? > принимается гипотеза об отсутствии систематической ошибки с вероятностью ? =1 - q. В противном случае (? < ) следует принять гипотезу о постоянной составляющей в статистической совокупности и для корректной оценки исследуемых параметров ее необходимо исключить из ряда измерений. Для этого получают усредненную величину систематического влияния, равную среднему арифметическому из всех элементов, которую и исключаем из измерений, получая новый ряд с уменьшенной по сравнению с исходным рядом систематической составляющей



По исследуемым величинам получаю практическую величину:



где

Проверим неравенство ( Неравенство не выполняется , значит модно утверждать, что в исследуемом ряде отсутствуют существенные систематические ошибки с вероятностью .

) Исследование ряда данных на наличие грубых ошибок по критерию Граббса. (В зависимости от требований задачи существует масса критериев, решающих поставленную задачу: критерий Граббса, Диксона, Шарлье, Шовенэ и др. В работе для выявления грубых погрешностей предлагается использовать критерий Граббса. Критерий дает вероятность выполнения выдвинутой гипотезы о том, что максимальное, или минимальное значение из ряда не являются грубыми погрешностями. Для этого по экстремальным значениям выборки Хтах и Xmin, среднему арифметическому и средней квадратической погрешности т, вычисляют значения



Если Zвыч < zq, для максимального и минимального значения, то следует принять гипотезу об отсутствии в ряде грубых погрешностей, так как экстремальные значения не являются грубыми. Значения теоретической величины критерия zq получают по заданному аргументу q и числу элементов в выборке п по специальным статистическим таблицам критерия Граббса для zq. Если же zfвыч > zq, тогда или наибольшее или наименьшее значение ряда из дальнейшей обработки следует исключить.



Если не имеется таблиц статистики критерия Смирнова-Граббса, то её можно достаточно точно получить на основе формулы

где ta/ 2nn-2 - квантиль t-распределения Стьюдента с уровнем значимости а.

-2 степенями свободы с п элементами в ряде.


Практические величины:

где , ,

Из статистических таблиц получим коэффициент



для вероятности и степени свободы , равный. Проверяемое неравенство выполняется для максимального и минимального значений ошибки:


Следовательно, можно утверждать, то с вероятностью ни левая, ни правая крайние в ряде ошибки не являются грубыми.

) Оценки основных характеристик ряда. Теоретическое значение математического ожидания для нормального закона распределения Гаусса равно нулю и, следовательно, если вычисленная его оценка M(X) будет отличаться от нуля на величину не более утроенной средней квадратической погрешности 3 *m = ?пред, то это говорит о том, что распределение исследуемых величин может быть близко к нормальному, но только по критерию близости теоретического значения математического ожидания к вычисленному значению. Оценки математического ожидания, дисперсии и стандарта получим по следующим формулам


Практические значения:

среднее арифметическое ;

средняя квадратическая ошибка ;

оценка дисперсии ;

5) Приближенные методы исследования на соответствие нормальному закону. Приближенные критерии исследования ряда погрешностей на соответствие нормальному закону распределения используют сравнение некоторых известных теоретических характеристик нормального закона и их вычисленного по результатам измерений аналога. Кроме наиболее распространенной средней квадратической погрешности т используют средние абсолютные v и вероятные (срединные) ошибки r. Между тремя ошибками т, V и r для нормального закона распределения величин имеются теоретически строгие соотношения



«Критерий ничтожных влияний», гласящий, что величина считается неизменной, если её вариация составляет не более 11% от самой величины.



Для вычисления средней абсолютной ошибки пользуются формулами:



Приближённые критерии на основе коэффициентов

=0,86 (при теоретическом значении 1.25)=0,77 (при теоретическом значении 1.48)=0,90 (при теоретическом значении 1.18)

Не все абсолютные отклонения между практическими и теоретическими значениями величин меньше допустимых по критерию ничтожных погрешностей 0,3930. 138,0.7120. 163,0,2840.130.

Характеристики будут такими:


Проведём контроль:

Эксцесс - мера «крутости».

Проведем контроль:


Это говорит о том, что эмпирическое распределение по отношению к теоретическому на допустимую величину скошено вправо (отрицательное) и на допустимую величину выше нормального (положительное).

6-8) Графический критерий исследования ряда погрешностей на соответствие нормальному закону распределения

Для дальнейших исследований погрешностей на соответствие их нормальному закону распределения строят для ряда одно из его графических представлений, например, в виде гистограммы или многоугольника распределения, с нанесенной поверх её теоретической кривой закона Гаусса с параметрами О и m, называемой огивой. В данной работе предлагается использовать гистограмму. Построение гистограммы начинают с разбиения ряда погрешностей на интервалы. Число интервалов к зависит от точности измерений, количества элементов в выборке и является в некотором смысле произвольным. Основное требование к количеству и величине интервалов заключается в том, чтобы полученный на их основе график был наглядным и правдоподобным. Длину интервала Q можно получить, например, используя следующие формулы


если известно число интервалов к, и



В геодезии чаще всего в такого рода исследованиях ряд делят на 12 интервалов, каждый из которых должен быть в 0.5 m.

Далее необходимо подсчитать число n. элементов ряда, принадлежащих j-му интервалу, и вычислить практические оценки неизвестных вероятностей (частоты ) по формуле



Вертикальные составляющие гистограммы, называемые высотами прямоугольников



На этом же графике необходимо построить теоретическую кривую, соответствующую нормальному закону, которая наилучшим образом сглаживает данное эмпирическое статистическое распределение. Кривая строится на основе формулы плотности вероятности для закона Гаусса


Наиболее точный критерий соответствия исследуемого ряда нормальному закону распределения получу, используя критерий ?2 Пирсона по формулам:



Здесь - теоретическая вероятность попаданияслучайной величины в соответствующий интервал.


Таблица построения гистограммы эмпирического закона распределения

Интервал в доляхИнтервал в секундахКоличество элементов в интервалеОтносит. частотаВысота прямоугольникаm(t)(Ø)-3m-2,50000-2,5m-2,0830,060,1441-2m-1,6730,060,1441-1,5m-1,2560,120,2882-1m-0,8350,10,2402-0,5m-0,4270,140,33630m0,0070,140,33630,5m0,4260,120,28821m0,8340,080,19211,5m1,2510,020,04802m1,6720,040,09612,5m2,0810,020,0480450,9

При этом сумма элементов по интервалам должна равняться общему количеству элементов в ряде; сумма частот равняется единице в пределах ошибки округления; сумма высот прямоугольников равняется 2/т. Выбрав масштабы по горизонтальной оси для величин интервалов (например, 0.5т - 1 см), по вертикальной для высот прямоугольников (например, 0.05 от - высоты прямоугольника - 1 см), откладывают по соответствующим границам вертикальные высоты, которые замыкаются в прямоугольники. Полученный график и будет называться гистограммой (эмпирическим представлением плотности закона распределения), площадь которого равна единице

) На этом же графике необходимо построить теоретическую кривую, соответствующую нормальному закону, которая наилучшим образом сглаживает (выравнивает) данное эмпирическое статистическое распределение. Кривая строится на основе формулы плотности вероятности для закона Гаусса



Обычно величина t изменяется от -3 до 3 через 0.5, так что вычисления не представляют трудности. Необходимо учитывать, что функция симметричная, т.е. f(x)= - f(x) Значения функции с m = 1 приведены в любых книгах по статистике или обработке измерений в виде таблиц и также могут быть использованы при вычислениях.

Значения теоретической функции плотности на границах интервалов будут равны:


t =00,511,522,53?(?)=0,480,420,290,160,060,020,01

По вычисленным данным строят график на гистограмме


10) Наиболее точный критерий соответствия исследуемого ряда нормальному закону распределения получим используя критерий -Пирсона.

Следует иметь в виду, что все критерии соответствия являются частными случаями общего алгоритма статистической проверки гипотез, в основе которой лежат следующие пункты:

) выдвижение с доверительной вероятностью исходной гипотезы;

) получение теоретического значения критерия;

) сравнение двух значений критериев и вывод.

Предположим, что с вероятностью ряд ошибок распределен нормально. Из статистических таблиц распределения -Пирсона по числу степеней свободы находим эталонное значение .


iИнтервалы в долях mn1 2 3 4 5 6 7 8 9 10 11 12 13-3 -2.5 -2.5 -2.00.0013 0.00620.0049 0.01650 30.25 0.85-0.25 2.15-2.0 -1.5 -1.5 -1.0 -1.0 -0.5 -0.5 0 0 0.5 0.5 1.0 1.0 1.5 1.5 2.0 2.0 2.5 2.5 3.0 3.00.0228 0.0668 0.1587 0.3085 0.5000 0.6915 0.8413 0.9332 0.9772 0.9938 0.99870.0441 0.0918 0.1499 0.1915 0.1915 0.1499 0.0918 0.0441 0.0165 0.00493 6 5 7 7 6 4 1 2 12.2 4.6 7.45 9.6 9.6 7.46 4.6 2.2 0.85 0.250.8 1.4 -2.45 -2.6 -2.6 -1.45 -0.6 -1.2 1.15 0.75?0.9984549.9

На основании проведенных исследований установлено, что рад является случайным, оценка математического ожидания в виде среднего арифметического не превосходит утроенной средней квадратической ошибки, то есть практически равна нулю. Количество положительных элементов (23) равно количеству отрицательных (27).

В результате вычисления критерия Аббе и сравнения практических и теоретических значений выявлено, что в ряду отсутствуют значимые систематические влияния с вероятностью и с этой же вероятностью крайние значения вариационного ряда не являются грубыми.

Приближённые критерии соответствия нормальному закону, учитывающие расхождения между теоретическими и практическими значениями соотношениями между тремя видами ошибок: средней квадратической, средней абсолютной и вероятной, показывают, что ряд соответствует нормальному закону. Значениями асимметрии и эксцесса можно пренебречь.

Визуальный анализ гистограммы (эмпирическое распределение) и огивы (вид теоретического закона распределения) показывает недостаточное согласование по форме и величине между ними, что говорит о недостаточном соответствии нормальному закону распределения.

Наиболее точные результаты соответствия исследуемого ряда нормальному закону дает критерий c2 Пирсона, который учитывает расхождение между практическими и теоретическими частотами по всем выделенным интервалам.

Таким образом, выполненные исследования ряда ошибок на соответствие нормальному закону распределения дают по всем использованным критериям положительные результаты, что позволяет сделать вывод о достаточной близости ряда предполагаемому закону. И сделать вывод, что мой ряд достаточно хорошо подчиняется нормальному закону распределения.

погрешность распределение закон статистический


Исследование ряда погрешностей на соответствие нормальному закону распределения 1. Теоретичес

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ