Основы эконометрики

 

Задание


Экономист, изучая зависимость уровня издержек обращения (тыс. руб.) от объема товарооборота (тыс. руб.), обследовал 10 магазинов, торгующих одинаковым ассортиментом товаров, и получил следующие данные (таблица 1).


Таблица 1

№ п/п12345678910х*Х14011012090130801007513560125У5,44,15,63,34,22,93,62,54,93,0

. Постройте поле корреляции и сформулируйте гипотезу о форме связи.

. Рассчитайте параметры уравнений линейной, степенной и гиперболической регрессии.

. Оцените тесноту связи с помощью показателей корреляции и детерминации.

. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом.

. Оцените с помощью средней ошибки аппроксимации качество уравнений регрессии.

. Оцените с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в п.п. 3-5 и данном пункте, выберите лучшее уравнение регрессии и дайте обоснование этого шага.

. Для выбранной лучшей модели постройте таблицу дисперсионного анализа и найдите доверительные интервалы для параметров регрессии и коэффициента корреляции.

8. Сделать прогноз значения при (см. задание) и найти доверительные интервалы прогноза для двух уравнений регрессии


.


. Оценить полученные результаты и сделать вывод.


Решение

уравнение корреляция регрессия аппроксимация

1. Построим диаграмму рассеивания по исходным данным для своего варианта


Y

4 2 50 100 150X


Из диаграммы следует, что между показателями и действительно наблюдается зависимость. Но сделать вывод какая именно, трудно, поэтому рассмотрим все три регрессии, а затем выберем лучшую.

А) Рассмотрим линейную регрессию.

Составим исходную расчетную таблицу. Для удобства можно добавить в нее еще два столбца: , чтобы сразу получить общую сумму квадратов.


№ п/пОбъем товарооборота (тыс. руб.)Издержки (тыс. руб.)11405,41960029,167565,250,150,022,7821104,11210016,814514,2-0,10,012,4331205,61440031,366724,551,051,118,754903,3810010,892973,5-0,20,046,0651304,21690017,645464,9-0,70,4916,676802,964008,412323,15-0,250,068,6271003,61000012,963603,85-0,250,066,948752,556256,25187,52,98-0,380,1415,291354,91822524,01661,55,07-0,170,033,4710603,0360091802,450,550,3018,33Итого104039,5114950166,49434339,502,2599,25Средн.зн.1043,951149516,65434,33,95--9,925

Функция издержек выразится зависимостью: .

Для определения коэффициентов «a» и «b» воспользуемся методом наименьших квадратов (МНК):


(1)


Домножим уравнение (1) системы на (-104), получим систему, которую решим методом алгебраического сложения.


b = 235или b = 0,03461.


Коэффициент корреляции b можно находить по формуле (2), не решая систему (1) непосредственно:

(2) ,


Результат аналогичен.

Теперь найдем коэффициент «a» из уравнения (1) системы (1):

a = 39,5-1040b; a = 0,35.

Или можно «a» вычислить по формуле (3) ,

.

Уравнение регрессии будет иметь вид: =0,35 + 0,035 x

Затем, подставляя различные значения из столбца 2, получим теоретические значения для столбца 7:

,

аналогично для … и .

В столбце 8 находим разность текущего значения и (теоретического), найденного по формуле (4).

Для расчета используем следующие формулы:


,,,

,,.


Коэффициент аппроксимации определим по формуле:


.


Средняя ошибка аппроксимации:

.


Допустимый предел значений - не более 10%, это говорит о том, что уравнение регрессии точно аппроксимирует исходную зависимость.

Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции . Найдем его по формуле для


.


Коэффициент . Характер связи устанавливается по таблице Чеддока:


Диапазон измерения0,1-0,30,3-0,50,5-0,70,7-0,90,9-0,99Характер тесноты связислабаяумереннаязаметнаявысокаявесьма высокая

В примере получилась связь прямая, высокая.

Для вычисления коэффициента , используются и другие формулы:


.


. Дисперсионный анализ. Общая сумма квадратов отклонений (т.е. общая дисперсия) равна:


,

где - общая сумма квадратов отклонений,

- сумма отклонений, обусловленная регрессией (факторная),

- остаточная сумма квадратов отклонений.


.


Остаточная сумма определена в таблице в 9 столбце и равна 2,25. Тогда объясненная (факторная) сумма квадратов будет равна

Долю дисперсии, объясняемую регрессией, в общей доле дисперсии характеризует индекс детерминации . Он определяется отношением объясненной дисперсии к общей


.


Качество всего уравнения регрессии в целом, проверяется F-тестом.

Составим таблицу дисперсионного анализа:


Источники вариацииЧисло степеней свободыквадр.

отклонений.Дисперсия на 1 степ. свободы.F отнФакттабл. (0,05)общая910,4658,21529,215,32объясненная18,215остаточная82,250,281

Fтабл определяем по [1] в зависимости от уровня значимости (? = 0,05) и числа степеней свободы (df=8). Fтабл=5,32.

F-тест состоит в проверке гипотезы Но о статистической незначимости уравнения регрессии и показателя тесноты связи rху.

Если Fфакт >Fтабл (29,21>5,32), то гипотеза Но о случайной природе оцениваемых характеристик отклоняется и признается их значимость и надежность.

Б) Степенная регрессия

Для того, чтобы построить степенную модель, необходимо линеаризовать переменные путем логарифмирования обеих частей уравнения :



Пусть , тогда

Рассчитываем и b по формулам:



Все необходимые расчеты представлены в таблице 2.


№ п/пxyXYXYX2Y211405,44,94161,6868,333524,4142,8435,10,30,0921104,14,70051,4116,632422,0971,9904,10031205,64,78751,7228,247922,9222,9684,41,21,444903,34,49981,1935,372320,2421,4243,5-0,20,0451304,24,86751,4356,985323,6962,0554,8-0,60,366802,94,38201,0644,665519,2011,1333,2-0,30,0971003,64,60521,28095,898821,20791,64073,8- 0,20,048752,54,31750,91633,956118,64080,83963,0-0,50,2591354,94,90531,58927,795524,06202,52564,90010603,04,09431,09864,498016,76331,20692,50,50,25Итого104039,546,101213,39862,3853213,25118,63439,30,22,56Средн.зн.1043,954,610121,33986,2385321,32511,8634

Параметры будут равны:

Подставим их в уравнение и получим линейное уравнение:



Потенцируя которое, получим:



По этому уравнению заполняется вторая половина таблицы.

В) Уравнение гиперболы

Линеаризуется при замене , тогда

Все необходимые расчеты представим в таблице 6.


№ п/пxy11405,40,0071430,0385720,0000514,90,50,2521104,10,0090900,0372690,0000824,3-0,20,0431205,60,0083330,0466670,0000694,6114903,30,0111110,0366670,0001233,7-0,40,1651304,20,0076920,0323060,0000594,8-0,60,366802,90,01250,036250,0001563,3-0,40,1671003,60,010,0360,00014,0-0,40,168752,50,0133330,0333320,0001773,0-0,50,2591354,90,0074070,0362940,0000544,80,10,0110603,00,0166670,050,0002772,011Сумма104039,50,1032760,3833570,00114839,43,39Ср. знач.1043,950,01032760,03833570,000115Найдем параметры и , используя МНК.

Для этого решим систему (1), учитывая, что .

Таким образом, получили систему уравнений:


::


Можно воспользоваться формулами.



Итак, получим уравнение:


.


Оценим тесноту связи результативным фактором и факторным признаком с помощью индекса корреляции (для нелинейных моделей) и коэффициента детерминации , которые рассчитываются по следующим формулам:


,


Для степенной регрессии:


Для уравнения гиперболы получим:



Найдем средний коэффициент эластичности по формулам, представленным в таблице 7.


Таблица 7

Вид регрессииФормула для расчетаЛинейнаяСтепеннаяГиперболическая

Найдем среднюю ошибку аппроксимации по формуле:


, где .


Оценим статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера:


.

Для степенной регрессии имеем:


.


Для уравнения гиперболы получим:


.


Для линейном модели уже строили таблицу дисперсионного анализа.

Для сравнения полученных уравнений регрессии построим следующую таблицу:


Вид регрессии, R2, r2FЛинейная0,8860,7859,9250,912329,212,25Степенная0,8690,7559,9890,8524,653,32Гиперболическая0,8220,67613,871,000216,6911,33

Из итоговой таблицы видно, что коэффициент корреляции наибольший для линейной регрессии, коэффициент детерминации max, а коэффициент аппроксимации минимален, поэтому можно сделать вывод: наиболее сильное влияние на уровень издержек в зависимости от товарооборота получается при использовании в качестве аппроксимирующей функции линейную функцию.

Для всех моделей , следовательно, все модели являются адекватными.

Из таблицы видно, что лучшим уравнением регрессии является линейная функция, так как коэффициент детерминации для этой функции является наибольшим из представленных в таблице, сумма квадратов отклонений фактических значений результативного признака от расчетных является наименьшей и средний коэффициент аппроксимации является наименьшим.

Если получается, что коэффициент детерминации для нелинейной регрессии больше коэффициента детерминации для линейной регрессии, надо рассмотреть модуль . Если разность небольшая, т.е. условие модуля выполняется, то все равно выбираем линейную регрессию для дальнейших расчетов.

Чем больше кривизна линии регрессии, тем <. Если превышает 0,1, то предположение о линейной форме связи считается не оправданным. В этом случае проводится оценка существенности различия по критерию Стьюдента.



- ошибка разности между и



Если t < 2, то различия между и несущественны, и возможно применение линейной регрессии.

Если t >2, то различия существенны и замена нелинейной регрессии уравнением линейной функции невозможна.

В нашем примере лучшей является линейная модель. Для линейной регрессии выполним дальнейшие расчеты.

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывают t-критерий.

Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:


,,;

,


где , или из табл. дисперсионного анализа (0,281).


,.


Для примера определим стандартную ошибку для параметра «b»:



Критерий Стьюдента для параметра «b» равен 5,46.

Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством: ,5,462=29,81.

Табличное значение tтабл критерия Стьюдента определяем по [1] для и уровня значимости 0,05 и числа степеней свободы df = 8, , т.к. > , то гипотезу о несущественности коэффициента регрессии можно отклонить.

Для расчета доверительного интервала определяем предельную ошибку для каждого показателя:



Доверительный интервал: , .

Для расчета доверительного интервала для параметра а, найдем:



, т. к. критерий Стьюдента двусторонний, а параметр а - положительный, то он значим. Найдем для него доверительный интервал:

Найдем доверительный интервал для параметра r:



Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательная, а верхняя положительная, то оцениваемый параметр принимается нулевым, т. к. не может одновременно принимать и положительное и отрицательное значения.

Прогнозное значение определяется путем подстановки в уравнение регрессии:



Вычислим ошибку прогноза для уравнения :


.


И для уравнения :


(*) ,

,


.

Для * ,

,


,

,

,


.

Для уравнения с :

,

.

Вывод: Целью данной контрольно-курсовой работы было определение количественной взаимосвязи между объемом товарооборота и объемом издержек на основе статистических данных. Для этого были построены уравнения линейной, степенной, гиперболической парной регрессии.

В ходе проведенного исследования выяснилось, что лучшей моделью для описания взаимосвязи между объемом товарооборота и объемом издержек является линейная функция =0,35 + 0,035 x.

На основе последнего уравнения можно предположить, что с увеличением товарооборота на 1 тыс. руб. потребительские расходы на душу населения увеличатся на 0,035 тыс. руб.

При выполнении расчетов выяснилось, средний коэффициент эластичности для линейной модели составляет 0,9123, т.е. с увеличением объема товарооборота на 1% объем издержек увеличивается в среднем на 0,9123%.

Коэффициент детерминации для линейной модели составил 0,785. Это означает, что уравнением регрессии объясняется 78,5% дисперсии результативного признака (объем издержек), а на долю прочих факторов приходится 21,5%, следовательно, линейная модель хорошо аппроксимирует исходные данные и ей можно пользоваться для прогноза значений результативного признака.

Так, полагая, что объем товарооборота составит 125 тыс. руб., то прогнозное значение для объема издержек окажется 4,725 тыс. руб., при этом с вероятностью 0,95 можно утверждать, что доверительные интервалы прогноза индивидуального значения результативного признака составят .


Литература


1. Новиков А.И. Эконометрика: Учеб. пособие. - М.: ИНФРА-М, 2010. - 144 с.

. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 2001. - XIV, - 402 с.

Елисеева И.И. Эконометрика: Учебник. - М.: Финансы и статистика, 2007. - 576 с.

. Елисеева И.И., Курышева С.В., Гордиенко Н.М. Практикум по эконометрике: Учебное пособие. - М.: Финансы и статистика, 2008 - 344 с.

5. Магнусян Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.: Дело, 2001. - 454 с.

. Кремер Н.Ш. Теория вероятностей и математическая статистика. - М.: ЮНИТИ-ДАНА, 2003. - 573 с.

. Кремер Н.Ш., Путко Б.А. Эконометрика. - М.: ЮНИТИ-ДАНА, 2002. - 435 с.

. Домбровский В.В. Эконометрика - М.: Новый учебник, 2004. - 342 с.



Задание Экономист, изучая зависимость уровня издержек обращения (тыс. руб.) от объема товарооборота (тыс. руб.), обследовал 10 магазинов, торгующих оди

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ