Основы эконометрики
Задание
Экономист, изучая зависимость уровня издержек обращения (тыс. руб.) от объема товарооборота (тыс. руб.), обследовал 10 магазинов, торгующих одинаковым ассортиментом товаров, и получил следующие данные (таблица 1).
Таблица 1
№ п/п12345678910х*Х14011012090130801007513560125У5,44,15,63,34,22,93,62,54,93,0
. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
. Рассчитайте параметры уравнений линейной, степенной и гиперболической регрессии.
. Оцените тесноту связи с помощью показателей корреляции и детерминации.
. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
. Оцените с помощью средней ошибки аппроксимации качество уравнений регрессии.
. Оцените с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в п.п. 3-5 и данном пункте, выберите лучшее уравнение регрессии и дайте обоснование этого шага.
. Для выбранной лучшей модели постройте таблицу дисперсионного анализа и найдите доверительные интервалы для параметров регрессии и коэффициента корреляции.
8. Сделать прогноз значения при (см. задание) и найти доверительные интервалы прогноза для двух уравнений регрессии
.
. Оценить полученные результаты и сделать вывод.
Решение
уравнение корреляция регрессия аппроксимация
1. Построим диаграмму рассеивания по исходным данным для своего варианта
Y
4 2 50 100 150X
Из диаграммы следует, что между показателями и действительно наблюдается зависимость. Но сделать вывод какая именно, трудно, поэтому рассмотрим все три регрессии, а затем выберем лучшую.
А) Рассмотрим линейную регрессию.
Составим исходную расчетную таблицу. Для удобства можно добавить в нее еще два столбца: , чтобы сразу получить общую сумму квадратов.
№ п/пОбъем товарооборота (тыс. руб.)Издержки (тыс. руб.)11405,41960029,167565,250,150,022,7821104,11210016,814514,2-0,10,012,4331205,61440031,366724,551,051,118,754903,3810010,892973,5-0,20,046,0651304,21690017,645464,9-0,70,4916,676802,964008,412323,15-0,250,068,6271003,61000012,963603,85-0,250,066,948752,556256,25187,52,98-0,380,1415,291354,91822524,01661,55,07-0,170,033,4710603,0360091802,450,550,3018,33Итого104039,5114950166,49434339,502,2599,25Средн.зн.1043,951149516,65434,33,95--9,925
Функция издержек выразится зависимостью: .
Для определения коэффициентов «a» и «b» воспользуемся методом наименьших квадратов (МНК):
(1)
Домножим уравнение (1) системы на (-104), получим систему, которую решим методом алгебраического сложения.
b = 235или b = 0,03461.
Коэффициент корреляции b можно находить по формуле (2), не решая систему (1) непосредственно:
(2) ,
Результат аналогичен.
Теперь найдем коэффициент «a» из уравнения (1) системы (1):
a = 39,5-1040b; a = 0,35.
Или можно «a» вычислить по формуле (3) ,
.
Уравнение регрессии будет иметь вид: =0,35 + 0,035 x
Затем, подставляя различные значения из столбца 2, получим теоретические значения для столбца 7:
,
аналогично для … и .
В столбце 8 находим разность текущего значения и (теоретического), найденного по формуле (4).
Для расчета используем следующие формулы:
,,,
,,.
Коэффициент аппроксимации определим по формуле:
.
Средняя ошибка аппроксимации:
.
Допустимый предел значений - не более 10%, это говорит о том, что уравнение регрессии точно аппроксимирует исходную зависимость.
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции . Найдем его по формуле для
.
Коэффициент . Характер связи устанавливается по таблице Чеддока:
Диапазон измерения0,1-0,30,3-0,50,5-0,70,7-0,90,9-0,99Характер тесноты связислабаяумереннаязаметнаявысокаявесьма высокая
В примере получилась связь прямая, высокая.
Для вычисления коэффициента , используются и другие формулы:
.
. Дисперсионный анализ. Общая сумма квадратов отклонений (т.е. общая дисперсия) равна:
,
где - общая сумма квадратов отклонений,
- сумма отклонений, обусловленная регрессией (факторная),
- остаточная сумма квадратов отклонений.
.
Остаточная сумма определена в таблице в 9 столбце и равна 2,25. Тогда объясненная (факторная) сумма квадратов будет равна
Долю дисперсии, объясняемую регрессией, в общей доле дисперсии характеризует индекс детерминации . Он определяется отношением объясненной дисперсии к общей
.
Качество всего уравнения регрессии в целом, проверяется F-тестом.
Составим таблицу дисперсионного анализа:
Источники вариацииЧисло степеней свободыквадр.
отклонений.Дисперсия на 1 степ. свободы.F отнФакттабл. (0,05)общая910,4658,21529,215,32объясненная18,215остаточная82,250,281
Fтабл определяем по [1] в зависимости от уровня значимости (? = 0,05) и числа степеней свободы (df=8). Fтабл=5,32.
F-тест состоит в проверке гипотезы Но о статистической незначимости уравнения регрессии и показателя тесноты связи rху.
Если Fфакт >Fтабл (29,21>5,32), то гипотеза Но о случайной природе оцениваемых характеристик отклоняется и признается их значимость и надежность.
Б) Степенная регрессия
Для того, чтобы построить степенную модель, необходимо линеаризовать переменные путем логарифмирования обеих частей уравнения :
Пусть , тогда
Рассчитываем и b по формулам:
Все необходимые расчеты представлены в таблице 2.
№ п/пxyXYXYX2Y211405,44,94161,6868,333524,4142,8435,10,30,0921104,14,70051,4116,632422,0971,9904,10031205,64,78751,7228,247922,9222,9684,41,21,444903,34,49981,1935,372320,2421,4243,5-0,20,0451304,24,86751,4356,985323,6962,0554,8-0,60,366802,94,38201,0644,665519,2011,1333,2-0,30,0971003,64,60521,28095,898821,20791,64073,8- 0,20,048752,54,31750,91633,956118,64080,83963,0-0,50,2591354,94,90531,58927,795524,06202,52564,90010603,04,09431,09864,498016,76331,20692,50,50,25Итого104039,546,101213,39862,3853213,25118,63439,30,22,56Средн.зн.1043,954,610121,33986,2385321,32511,8634
Параметры будут равны:
Подставим их в уравнение и получим линейное уравнение:
Потенцируя которое, получим:
По этому уравнению заполняется вторая половина таблицы.
В) Уравнение гиперболы
Линеаризуется при замене , тогда
Все необходимые расчеты представим в таблице 6.
№ п/пxy11405,40,0071430,0385720,0000514,90,50,2521104,10,0090900,0372690,0000824,3-0,20,0431205,60,0083330,0466670,0000694,6114903,30,0111110,0366670,0001233,7-0,40,1651304,20,0076920,0323060,0000594,8-0,60,366802,90,01250,036250,0001563,3-0,40,1671003,60,010,0360,00014,0-0,40,168752,50,0133330,0333320,0001773,0-0,50,2591354,90,0074070,0362940,0000544,80,10,0110603,00,0166670,050,0002772,011Сумма104039,50,1032760,3833570,00114839,43,39Ср. знач.1043,950,01032760,03833570,000115Найдем параметры и , используя МНК.
Для этого решим систему (1), учитывая, что .
Таким образом, получили систему уравнений:
::
Можно воспользоваться формулами.
Итак, получим уравнение:
.
Оценим тесноту связи результативным фактором и факторным признаком с помощью индекса корреляции (для нелинейных моделей) и коэффициента детерминации , которые рассчитываются по следующим формулам:
,
Для степенной регрессии:
Для уравнения гиперболы получим:
Найдем средний коэффициент эластичности по формулам, представленным в таблице 7.
Таблица 7
Вид регрессииФормула для расчетаЛинейнаяСтепеннаяГиперболическая
Найдем среднюю ошибку аппроксимации по формуле:
, где .
Оценим статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера:
.
Для степенной регрессии имеем:
.
Для уравнения гиперболы получим:
.
Для линейном модели уже строили таблицу дисперсионного анализа.
Для сравнения полученных уравнений регрессии построим следующую таблицу:
Вид регрессии, R2, r2FЛинейная0,8860,7859,9250,912329,212,25Степенная0,8690,7559,9890,8524,653,32Гиперболическая0,8220,67613,871,000216,6911,33
Из итоговой таблицы видно, что коэффициент корреляции наибольший для линейной регрессии, коэффициент детерминации max, а коэффициент аппроксимации минимален, поэтому можно сделать вывод: наиболее сильное влияние на уровень издержек в зависимости от товарооборота получается при использовании в качестве аппроксимирующей функции линейную функцию.
Для всех моделей , следовательно, все модели являются адекватными.
Из таблицы видно, что лучшим уравнением регрессии является линейная функция, так как коэффициент детерминации для этой функции является наибольшим из представленных в таблице, сумма квадратов отклонений фактических значений результативного признака от расчетных является наименьшей и средний коэффициент аппроксимации является наименьшим.
Если получается, что коэффициент детерминации для нелинейной регрессии больше коэффициента детерминации для линейной регрессии, надо рассмотреть модуль . Если разность небольшая, т.е. условие модуля выполняется, то все равно выбираем линейную регрессию для дальнейших расчетов.
Чем больше кривизна линии регрессии, тем <. Если превышает 0,1, то предположение о линейной форме связи считается не оправданным. В этом случае проводится оценка существенности различия по критерию Стьюдента.
- ошибка разности между и
Если t < 2, то различия между и несущественны, и возможно применение линейной регрессии.
Если t >2, то различия существенны и замена нелинейной регрессии уравнением линейной функции невозможна.
В нашем примере лучшей является линейная модель. Для линейной регрессии выполним дальнейшие расчеты.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывают t-критерий.
Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:
,,;
,
где , или из табл. дисперсионного анализа (0,281).
,.
Для примера определим стандартную ошибку для параметра «b»:
Критерий Стьюдента для параметра «b» равен 5,46.
Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством: ,5,462=29,81.
Табличное значение tтабл критерия Стьюдента определяем по [1] для и уровня значимости 0,05 и числа степеней свободы df = 8, , т.к. > , то гипотезу о несущественности коэффициента регрессии можно отклонить.
Для расчета доверительного интервала определяем предельную ошибку для каждого показателя:
Доверительный интервал: , .
Для расчета доверительного интервала для параметра а, найдем:
, т. к. критерий Стьюдента двусторонний, а параметр а - положительный, то он значим. Найдем для него доверительный интервал:
Найдем доверительный интервал для параметра r:
Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательная, а верхняя положительная, то оцениваемый параметр принимается нулевым, т. к. не может одновременно принимать и положительное и отрицательное значения.
Прогнозное значение определяется путем подстановки в уравнение регрессии:
Вычислим ошибку прогноза для уравнения :
.
И для уравнения :
(*) ,
,
.
Для * ,
,
,
,
,
.
Для уравнения с :
,
.
Вывод: Целью данной контрольно-курсовой работы было определение количественной взаимосвязи между объемом товарооборота и объемом издержек на основе статистических данных. Для этого были построены уравнения линейной, степенной, гиперболической парной регрессии.
В ходе проведенного исследования выяснилось, что лучшей моделью для описания взаимосвязи между объемом товарооборота и объемом издержек является линейная функция =0,35 + 0,035 x.
На основе последнего уравнения можно предположить, что с увеличением товарооборота на 1 тыс. руб. потребительские расходы на душу населения увеличатся на 0,035 тыс. руб.
При выполнении расчетов выяснилось, средний коэффициент эластичности для линейной модели составляет 0,9123, т.е. с увеличением объема товарооборота на 1% объем издержек увеличивается в среднем на 0,9123%.
Коэффициент детерминации для линейной модели составил 0,785. Это означает, что уравнением регрессии объясняется 78,5% дисперсии результативного признака (объем издержек), а на долю прочих факторов приходится 21,5%, следовательно, линейная модель хорошо аппроксимирует исходные данные и ей можно пользоваться для прогноза значений результативного признака.
Так, полагая, что объем товарооборота составит 125 тыс. руб., то прогнозное значение для объема издержек окажется 4,725 тыс. руб., при этом с вероятностью 0,95 можно утверждать, что доверительные интервалы прогноза индивидуального значения результативного признака составят .
Литература
1. Новиков А.И. Эконометрика: Учеб. пособие. - М.: ИНФРА-М, 2010. - 144 с.
. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 2001. - XIV, - 402 с.
Елисеева И.И. Эконометрика: Учебник. - М.: Финансы и статистика, 2007. - 576 с.
. Елисеева И.И., Курышева С.В., Гордиенко Н.М. Практикум по эконометрике: Учебное пособие. - М.: Финансы и статистика, 2008 - 344 с.
5. Магнусян Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.: Дело, 2001. - 454 с.
. Кремер Н.Ш. Теория вероятностей и математическая статистика. - М.: ЮНИТИ-ДАНА, 2003. - 573 с.
. Кремер Н.Ш., Путко Б.А. Эконометрика. - М.: ЮНИТИ-ДАНА, 2002. - 435 с.
. Домбровский В.В. Эконометрика - М.: Новый учебник, 2004. - 342 с.
Больше работ по теме:
Предмет: Менеджмент
Тип работы: Контрольная работа
Новости образования
КОНТАКТНЫЙ EMAIL: [email protected]
Скачать реферат © 2017 | Пользовательское соглашение
ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ