Вероятностно-статистические методы моделирования экономических систем

 
















Вероятностно-статистические методы моделирования экономических систем



Введение


Под задачей идентификации закона распределения наблюдаемой случайной величины (структурно-параметрической идентификации), как правило, понимают задачу выбора такой параметрической модели закона распределения вероятностей, которая наилучшим образом соответствует результатам экспериментальных наблюдений. Случайные ошибки средств измерений не так уж часто подчиняются нормальному закону, точнее, не так часто хорошо описываются моделью нормального закона. В основе измерительных приборов и систем лежат различные физические принципы, различные методы измерений и различные преобразования измерительных сигналов. Погрешности измерений как величины являются следствием влияния множества факторов, случайного и неслучайного характера, действующих постоянно или эпизодически. Поэтому понятно, что только при выполнении определенных предпосылок (теоретических и технических) погрешности измерений достаточно хорошо описываются моделью нормального закона.

Вообще говоря, следует понимать, что истинный закон распределения (если он, конечно, существует), описывающий погрешности конкретной измерительной системы, остается (останется) неизвестным, не смотря на все наши попытки его идентифицировать. На основании данных измерений и теоретических соображений мы можем только подобрать вероятностную модель, которая в некотором смысле наилучшим образом приближает этот истинный закон. Если построенная модель адекватна, то есть применяемые критерии не дают оснований для ее отклонения, то на основе данной модели можно вычислить все интересующие нас вероятностные характеристики случайной составляющей погрешности измерительного средства, которые будут отличаться от истинных значений только за счет не исключенной систематической (ненаблюдаемой или нерегистрируемой) составляющей погрешности измерений. Ее малость и характеризует правильность измерений. Множество возможных законов распределения вероятностей, которые можно использовать для описания наблюдаемых случайных величин, не ограничено. Бессмысленно ставить целью задачи идентификации нахождение истинного закона распределения наблюдаемой величины. Мы можем лишь решать задачу выбора наилучшей модели из некоторого множества. Например, из того множества параметрических законов и семейств распределений, которые используются в приложениях, и упоминание о которых можно найти в литературных источниках.

Классический подход к структурно-параметрической идентификации закона распределения. Под классическим подходом будем понимать алгоритм выбора закона распределения, целиком базирующийся на аппарате математической статистики.



1. Элементарные понятия о случайных событиях, величинах и функциях


Мы уже видели, что для многих экспериментов нет никаких различий в подсчёте вероятностей событий, тогда как элементарные исходы в этих экспериментах очень различаются. Но нас и должны интересовать именно вероятности событий, а не структура пространства элементарных исходов. Поэтому пора во всех таких «похожих» экспериментах вместо самых разных элементарных исходов использовать, например, числа. Иначе говоря, каждому элементарному исходу поставить в соответствие некоторое вещественное число, и работать только с числами.

Пусть задано вероятностное пространство .

Определение 26. Функция называется случайной величиной, если для любого борелевского множества множество является событием, т.е. принадлежит -алгебре .

Множество , состоящее из тех элементарных исходов , для которых принадлежит , называется полным прообразом множества .

Замечание 9. Вообще, пусть функция действует из множества в множество , и заданы -алгебры и подмножеств и соответственно. Функция называется измеримой, если для любого множества его полный прообраз принадлежит .

Замечание 10. Читатель, не желающий забивать себе голову абстракциями, связанными с -алгебрами событий и с измеримостью, может смело считать, что любое множество элементарных исходов есть событие, и, следовательно, случайная величина есть произвольная функция из в . Неприятностей на практике это не влечёт, так что всё дальнейшее в этом параграфе можно пропустить.

Теперь, избавившись от нелюбопытных читателей, попробуем понять, зачем случайной величине нужна измеримость.

Если задана случайная величина , нам может потребоваться вычислить вероятности вида , , , (и вообще самые разные вероятности попадания в борелевские множества на прямой). Это возможно лишь если множества, стоящие под знаком вероятности, являются событиями - ведь вероятность есть функция, определённая только на -алгебре событий. Требование измеримости равносильно тому, что для любого борелевского множества определена вероятность .

Можно потребовать в определении 26 чего-нибудь другого. Например, чтобы событием было попадание в любой интервал: , или в любой полуинтервал: .

Убедимся, например, что эквивалентны определения 26 и 27:

Определение 27. Функция называется случайной величиной, если для любых вещественных множество принадлежит -алгебре .

Доказательство эквивалентности определений 26, 27.

Если - случайная величина в смысле определения 26, то она будет случайной величиной и в смысле определения 27, поскольку любой интервал является борелевским множеством.

Докажем, что верно и обратное. Пусть для любого интервала выполнено . Мы должны доказать, что то же самое верно и для любых борелевских множеств.

Соберём в множестве все подмножества вещественной прямой, прообразы которых являются событиями. Множество уже содержит все интервалы . Покажем теперь, что множество является -алгеброй. По определению, тогда и только тогда, когда множество принадлежит .

1. Убедимся, что . Но и, следовательно, .

2. Убедимся, что для любого . Пусть . Тогда , так как - -алгебра.

3. Убедимся, что для любых . Пусть для всех . Но - -алгебра, поэтому

Мы доказали, что - -алгебра и содержит все интервалы на прямой. Но - наименьшая из -алгебр, содержащих все интервалы на прямой. Следовательно, содержит : .

Приведём примеры измеримых и неизмеримых функций.

Пример 25. Подбрасываем кубик. Пусть , и две функции из в заданы так: , . Пока не задана -алгебра , нельзя говорить об измеримости. Функция, измеримая относительно какой-то -алгебры , может не быть таковой для другой .

. Если есть множество всех подмножеств , то и являются случайными величинами, поскольку любое множество элементарных исходов принадлежит , в том числе и или . Можно записать соответствие между значениями случайных величин и и вероятностями принимать эти значения в виде «таблицы распределения вероятностей» или, коротко, «таблицы распределения»:



Здесь .


2. Пусть -алгебра событий состоит из четырёх множеств:


,


т.е. событием является, кроме достоверного и невозможного событий, выпадение чётного или нечётного числа очков. Убедимся, что при такой сравнительно бедной -алгебре ни , ни не являются случайными величинами, поскольку они неизмеримы. Возьмём, скажем, . Видим, что и


2. Числовые характеристики случайных величин


Математическое ожидание. Математическим ожиданием дискретной случайной величины Х, принимающей конечное число значений хi с вероятностями рi, называется сумма:


(6а)


Математическим ожиданием непрерывной случайной величины Х называется интеграл от произведения ее значений х на плотность распределения вероятностей f(x):


(6б)


Несобственный интеграл (6б) предполагается абсолютно сходящимся (в противном случае говорят, что математическое ожидание М (Х) не существует). Математическое ожидание характеризует среднее значение случайной величины Х. Его размерность совпадает с размерностью случайной величины. Свойства математического ожидания:


(7)


Дисперсия. Дисперсией случайной величины Х называется число:


(8)


Дисперсия является характеристикой рассеяния значений случайной величины Х относительно ее среднего значения М (Х). Размерность дисперсии равна размерности случайной величины в квадрате. Исходя из определений дисперсии (8) и математического ожидания (5) для дискретной случайной величины и (6) для непрерывной случайной величины получим аналогичные выражения для дисперсии:


(9)


Здесь m = М (Х).

Свойства дисперсии:


(10)



Среднее квадратичное отклонение:


(11)


Так как размерность среднего квадратичного отклонения та же, что и у случайной величины, оно чаще, чем дисперсия, используется как мера рассеяния.

Моменты распределения. Понятия математического ожидания и дисперсии являются частными случаями более общего понятия для числовых характеристик случайных величин - моментов распределения. Моменты распределения случайной величины вводятся как математические ожидания некоторых простейших функций от случайной величины. Так, моментом порядка k относительно точки х0называется математическое ожидание М (Х - х0) k. Моменты относительно начала координат х = 0 называются начальными моментами и обозначаются:


(12)


Начальный момент первого порядка есть центр распределения рассматриваемой случайной величины:


(13)


Моменты относительно центра распределения х = m называются центральными моментами и обозначаются:


(14)


Из (7) следует, что центральный момент первого порядка всегда равен нулю:


(15)


Центральные моменты не зависят от начала отсчета значений случайной величины, так как при сдвиге на постоянное значение С ее центр распределения сдвигается на то же значение С, а отклонение от центра не меняется:


Х - m = (Х - С) - (m - С).


Теперь очевидно, что дисперсия - это центральный момент второго порядка:


(16)


Асимметрия. Центральный момент третьего порядка:


(17)


служит для оценки асимметрии распределения. Если распределение симметрично относительно точки х = m, то центральный момент третьего порядка будет равен нулю (как и все центральные моменты нечетных порядков). Поэтому, если центральный момент третьего порядка отличен от нуля, то распределение не может быть симметричным. Величину асимметрии оценивают с помощью безразмерного коэффициента асимметрии:


(18)


Знак коэффициента асимметрии (18) указывает на правостороннюю или левостороннюю асимметрию (рис. 2).


Рис. 1. Виды асимметрии распределений


Эксцесс. Центральный момент четвертого порядка:


(19)


служит для оценки так называемого эксцесса, определяющего степень крутости (островершинности) кривой распределения вблизи центра распределения по отношению к кривой нормального распределения. Так как для нормального распределения, то в качестве эксцесса принимается величина:


(20)


На рис. 3 приведены примеры кривых распределения с различными значениями эксцесса. Для нормального распределения Е = 0. Кривые, более островершинные, чем нормальная, имеют положительный эксцесс, более плосковершинные - отрицательный.


Рис. 2. Кривые распределения с различной степенью крутости (эксцессом)


Моменты более высоких порядков в инженерных приложениях математической статистики обычно не применяются.

Мода дискретной случайной величины - это ее наиболее вероятное значение. Модой непрерывной случайной величины называется ее значение, при котором плотность вероятности максимальна (рис. 2). Если кривая распределения имеет один максимум, то распределение называется унимодальным. Если кривая распределения имеет более одного максимума, то распределение называется полимодальным. Иногда встречаются распределения, кривые которых имеют не максимум, а минимум. Такие распределения называются антимодальными. В общем случае мода и математическое ожидание случайной величины не совпадают. В частном случае, для модального, т.е. имеющего моду, симметричного распределения и при условии, что существует математическое ожидание, последнее совпадает с модой и центром симметрии распределения.

Медиана случайной величины Х - это ее значение Ме, для которого имеет место равенство: т.е. равновероятно, что случайная величина Х окажется меньше или больше Ме. Геометрически медиана - это абсцисса точки, в которой площадь под кривой распределения делится пополам. В случае симметричного модального распределения медиана, мода и математическое ожидание совпадают.


. Статистическая оценка законов распределения случайных величин


Генеральной совокупностью - называется совокупность всех подлежащих изучению объектов или возможных результатов всех наблюдений, производимых в одинаковых условиях над одним объектом.

Выборочной совокупностью или выборкой называется совокупность объектов или результатов наблюдения над объектом, отобранных случайным образом из генеральной совокупности.

Объемом выборки называется число объектов или наблюдений в выборке.

Конкретные значения выборки называются наблюдаемыми значениями случайной величины Х. Наблюдаемые значения заносятся в протокол. Протокол представляет собой таблицу. Составленный протокол является первичной формой записи обработки полученного материала. Для получения достоверных, надежных выводов выборка должна быть достаточно представительной по объему. Большая выборка - это неупорядоченное множество чисел. Для исследования выборку приводят к наглядному упорядоченному виду. Для этого в протоколе находят наибольшее и наименьшее значения случайной величины. Выборка, отсортированная по возрастанию, приведена в таблице 1.

Таблица 1. Протокол

-8,66-5,49-4,11-3,48-2,9-2,32-1,82-1,09-0,440,64-8,31-4,71-3,92-3,41-2,85-2,31-1,82-1,01-0,430,71-8,23-4,68-3,85-3,33-2,83-2,29-1,8-0,99-0,430,73-7,67-4,6-3,85-3,25-2,77-2,27-1,77-0,95-0,310,99-6,64-4,43-3,81-3,08-2,72-2,25-1,73-0,89-0,31,03-6,6-4,38-3,8-3,07-2,67-2,19-1,38-0,70,041,05-6,22-4,38-3,77-3,01-2,6-2,15-1,32-0,560,081,13-5,87-4,25-3,73-3,01-2,49-2,09-1,3-0,510,151,76-5,74-4,18-3,59-2,99-2,37-2,01-1,28-0,490,262,95-5,68-4,14-3,49-2,98-2,33-1,91-1,24-0,480,534,42

Размахом выборки называется разность между наибольшим и наименьшим значением случайной величины Х:



Размах выборки разбивают на k интервалов - разрядов. Число разрядов устанавливают в зависимости от величины размаха выборки от 8 до 25, в этой курсовой работе примем k = 10.

Тогда длина интервала будет равна:



В протоколе подсчитаем число наблюдаемых значений, попавших в каждый интервал, обозначим их m1, m2,…, m10. .

Назовем mi частотой попадания случайной величины в i интервал. Если какое-либо наблюдаемое значение случайной величины совпадает с концом интервала, то это значение случайной величины по договоренности относят в один из интервалов.

После того как определили частоты mi, определим частости случайной величины, т.е. найдем отношение частот mi к общему числу наблюдаемых значений n.

- частость, условие полноты -

Найдем середину каждого интервала: .

Составим таблицу 2

Таблица значений границ интервалов и соответствующих частостей , где i = 1, 2, 3, …, k, называется статистическим рядом. Графическим изображением статистического ряда называется гистограмма. Она строится следующим образом: по оси абсцисс откладывают интервалы и на каждом таком интервале, как на основании, строится прямоугольник, площадь которого равна соответствующей частости.

, - высота прямоугольника, .


Таблица 2

Номер интервалаЛевая граница интервалаПравая граница интервалаИнтервалСередина интервалаЧастота интервалаЧастость интервалаВысота прямо-угольника1-8,66-7,352(-8,66; -7,352)-8,00640,040,03062-7,352-6,044(-7,352; -6,044)-6,69830,030,02293-6,044-4,736(-6,044; -4,736)-5,3940,040,03064-4,736-3,428(-4,736; -3,428)-4,082200,20,15295-3,428-2,12(-3,428; -2,12)-2,774260,260,19886-2,12-0,812(-2,12; -0,812)-1,466180,180,13767-0,8120,496(-0,812; 0,496)-0,158140,140,107080,4961,804(0,496; 1,804)1,1590,090,068891,8043,112(1,804; 3,112)2,45810,010,0076103,1124,42(3,112; 4,42)3,76610,010,0076Сумма1001

Рисунок 3


Статистической функцией распределения называется частость случайной величины, не превосходящая заданного значения Х:

Для дискретной случайной величины Х статистическая функция распределения находится по формуле:



Запишем статистическую функцию распределения в развернутом виде:



где - это середина интервала i, а - это соответствующие частости, где i=1, 2,…, k.




График статистической функции распределения есть ступенчатая линия, точками разрыва которой являются середины интервалов, а конечные скачки равны соответствующим частотам.


Рисунок 3


Вычисление числовых характеристик статистического ряда

- статистическое математическое ожидание,

- статистическая дисперсия,

- статистическое среднеквадратическое отклонение.

Статистическим математическим ожиданием или статистическим средним называется среднеарифметическое наблюдаемых значений случайной величины Х.



Статистической дисперсией называется среднеарифметическое значение величиныили



При большом объеме выборки вычисления по формулам и приводят к громоздким выкладкам. Для упрощения расчетов используют статистический ряд с границами и частостями , где i = 1, 2, 3, …, k, находят середины интервалов , а затем все элементы выборки, которые попали в интервал, заменяют единственным значением, тогда таких значений будетв каждом интервале .



где - среднее значение соответствующего интервала; - частость интервала



Таблица 4. Числовые характеристики

Номер интервалаСередина интервала XiЧастость PiXiPi(Xi-m)^2(Xi-m)^2*Pi1-8,0060,04-0,320231,486911,25952-6,6980,03-0,200918,518560,55563-5,390,04-0,21568,971940,35894-4,0820,20-0,81642,847050,56945-2,7740,26-0,72120,143880,03746-1,4660,18-0,26390,862450,15527-0,1580,14-0,02215,002740,700481,150,090,103512,564761,130892,4580,010,024623,548500,2355103,7660,010,037737,953980,3795Статистическое математическое ожидание-2,3947Статистическая дисперсия5,3822Статистическое среднее квадратическое отклонение2,3200

определяет положение центра группировки наблюдаемых значений случайной величины.

, характеризуют рассеяние наблюдаемых значений случайной величины вокруг

Во всяком статистическом распределении неизбежно присутствуют элементы случайности. Однако при очень большом числе наблюдений эти случайности сглаживаются, и случайные явления обнаруживают присущую ему закономерность.

При обработке статистического материала приходится решать вопрос о том, как подобрать для данного статистического ряда теоретическую кривую. Эта теоретическая кривая распределения должна выражать существенные черты статистического распределения - эта задача называется задачей сглаживания или выравнивания статистического ряда.

Иногда общий вид распределения случайной величины Х вытекает из самой природы этой случайной величины.

Пусть случайная величина Х - это результат измерения некоторой физической величины прибора.

Х = точное значение физической величины + ошибка прибора.

Случайная ошибка прибора при измерении имеет суммарную природу и распределена по нормальному закону. Следовательно такое же распределение имеет случайная величина Х, т.е. нормальное распределение с плотностью вероятности:


, где , , .


Параметры и определяются так, чтобы числовые характеристики теоретического распределения были равны соответствующим числовым характеристикам статистического распределения. При нормальном распределении полагают, что ,,, тогда функция нормального распределения примет вид:



Таблица 5. Выравнивающая кривая

Номер интервалаСередина интервала XiТабулированная функцияНормальная кривая 1-8,0060-2,41870,02140,00922-6,6980-1,85490,07140,03083-5,3900-1,29110,17340,07474-4,0820-0,72730,30620,13205-2,7740-0,16350,39360,1697M-2,394700,39890,17206-1,46600,40030,36820,15877-0,15800,96410,25070,108081,15001,52790,12420,053592,45802,09170,04480,0193103,76602,65550,01170,0051

Теоретическую нормальную кривую строим по точкам на одном графике с гистограммой статистического ряда (Ошибка! Источник ссылки не найден).


Рисунок 6


Выравнивание статистической функции распределения

Статистическую функцию распределения выравниваем функцией распределения нормального закона:


,


где,, - функция Лапласа.


Таблица 7. Функция распределения

Номер интервалаСередина интервала XiФункция Лапласа Функция распределения1-8,0060-2,4187-0,49220,00782-6,6980-1,8549-0,46820,03183-5,3900-1,2911-0,40170,09834-4,0820-0,7273-0,26650,23355-2,7740-0,1635-0,06490,4351m-2,3947000,50006-1,46600,40030,15550,65557-0,15800,96410,33250,832581,15001,52790,43670,936792,45802,09170,48180,9818103,76602,65550,49600,9960

Строим график теоретической функции распределения по точкам / вместе с графиком статистической функции распределения.


Рисунок 6


Пусть изучается случайная величина Х с математическим ожиданием и дисперсией, оба параметра неизвестны.

Пусть х1, х2, х3, …, хn - выборка, полученная в результате проведения n независимых наблюдений случайной величины Х. Чтобы подчеркнуть случайный характер величин х1, х2, х3, …, хn перепишем их в виде:

Х1, Х2, Х3, …, Хn, где Хi - значение случайной величины Х в i-ом опыте.

Требуется на основании этих опытных данных оценить математическое ожидание и дисперсию случайной величины. Такие оценки называются точечными, в качестве оценки m и D можно принять статистическое математическое ожидание и статистическую дисперсию , где


,


До проведения опыта выборка Х1, Х2, Х3, …, Хn есть совокупность независимых случайных величин, которые имеют математическое ожидание и дисперсию, а значит распределение вероятности такие же как и сама случайная величина Х. Таким образом:


,, где i = 1, 2, 3, …, n.


Исходя из этого, найдем математическое ожидание и дисперсию случайной величины (пользуясь свойствами математического ожидания).



Таким образом математическое ожидание статистического среднего равно точному значению математического ожидания m измеряемой величины, а дисперсия статистического среднего в n раз меньше дисперсии отдельных результатов измерений.


при


Это значит, что при большом объеме выборки N статистическое средние является величиной почти неслучайной, оно лишь незначительно отклоняется от точного значения случайной величины m. Этот закон называется законом больших чисел Чебышева.

Точечные оценки неизвестных значений математического ожидания и дисперсии имеют большое значение на первоначальном этапе обработки статических данных. Их недостаток в том, что неизвестно с кокой точностью они дают оцениваемый параметр.

Пусть по данной выборке Х1, Х2, Х3, …, Хn получены точные статистические оценки и, тогда числовые характеристики случайной величины Х будут приближенно равны . Для выборки небольшого объема вопрос поточности оценки существенен, т.к. между m и, D и будут недостаточно большие отклонения. Кроме того при решении практических задач требуется не только найти приближенные значения m и D, но и оценить их точность и надежность. Пусть , т.е. является точечной оценкой для m. Очевидно, чтотем точнее определяет m, чем меньше модуль разности . Пусть , где ?>0, тогда, чем меньше ?, тем точнее оценка m. Таким образом, ?>0 характеризует точность оценки параметра. Однако статистические методы не позволяют категорически утверждать, что оценка истинного значения m удовлетворяет, можно лишь говорить о вероятности ?, с которой это неравенство выполняется:

Таким образом, ? - это доверительная вероятность или надежность оценки, значение ? выбираются заранее в зависимости от решаемой задачи. Надежность ? принято выбирать 0.9; 0.95; 0.99; 0.999. События с такой вероятностью являются практически достоверными. По заданной доверительной вероятности можно найти число ?>0 из .

Тогда получим интервал, который накрывает с вероятностью ? истинное значение математического ожидания m, длина этого интервала равна 2?. Этот интервал называется доверительным интервалом. А такой способ оценки неизвестного параметра m - интервальным.


Рис. 7


Пусть дана выборка Х1, Х2, Х3, …, Хn, и пусть по этой выборке найдено ,,.

Требуется найти доверительный интервал для математического ожидания m с доверительной вероятностью ?. Величина есть величина случайная с математическим ожиданием,.

Случайная величина имеет суммарную природу, при большом объеме выборки она распределена по закону близкому к нормальному. Тогда вероятность попадания случайной величины в интервал будет равна:


, где


Где - функция Лапласа.

Из формулы (3) и таблиц функции Лапласа находим число ?>0 и записываем доверительный интервал для точного значения случайной величины Х с надежностью ?.

В этой курсовой работе значение ? заменим, и тогда формула (3) примет вид:



Найдем доверительный интервал , в котором находится математическое ожидание. При ? = 0.99, n = 100, ,.

по таблицам Лапласа находим:

Отсюда ? = 0,5986.

- доверительный интервал, в котором с вероятностью 99% находится точное значение математического ожидания.



Заключение

случайный величина распределение экономический

Решение задач структурно-параметрической идентификации при ограниченных объемах выборок, которыми, как правило, обладают метрологи, обостряет проблему. В этом случае еще более важными оказываются корректность применения статистических методов анализа, использование оценок, обладающих наилучшими статистическими свойствами, и критериев, обладающих наибольшей мощностью.

При решении задач идентификации предпочтительнее опираться на классический подход. При идентификации рекомендуется рассматривать более широкое множество законов распределения, в том числе модели в виде смесей законов. В этом случае для любого эмпирического распределения мы всегда сможем построить адекватную, статистически существенно более обоснованную математическую модель.

Следует ориентироваться на использование и разработку программных систем, обеспечивающих решение задач структурно-параметрической идентификации законов распределений при любой форме регистрируемых наблюдений (измерений), включающих современные методы статистического анализа, ориентироваться на широкое, но корректное использование в исследованиях методов компьютерного моделирования. Мы уже видели, что для многих экспериментов нет никаких различий в подсчёте вероятностей событий, тогда как элементарные исходы в этих экспериментах очень различаются. Но нас и должны интересовать именно вероятности событий, а не структура пространства элементарных исходов. Поэтому пора во всех таких «похожих» экспериментах вместо самых разных элементарных исходов использовать, например, числа. Иначе говоря, каждому элементарному исходу поставить в соответствие некоторое вещественное число, и работать только с числами.



Вероятностно-статистические методы моделирования экономических систем Введение Под

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ