Регрессия и корреляция

 

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ПУТЕЙ СООБЩЕНИЯ (МИИТ)

ИНСТИТУТ ЭКОНОМИКИ И ФИНАНСОВ

ВЫСШАЯ ТРАНСПОРТНАЯ БИЗНЕС-ШКОЛА


ПРОГРАММА «Мастер делового администрирования - MBA»

СПЕЦИАЛИЗАЦИЯ «Корпоративные финансы на транспорте»


УЧЕБНЫЙ КУРС «ЭКОНОМИЧЕСКАЯ СТАТИСТИКА И КОЛИЧЕСТВЕННЫЕ МЕТОДЫ В ЭКОНОМИКЕ»





Домашнее задание

РЕГРЕССИЯ И КОРРЕЛЯЦИЯ

Вариант № 16




Выполнил Тарасов С.Л.

Проверил доц., к.т.н. Карпенко Н.В.








Москва - 2013

ЗАДАНИЕ 1. ПАРНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ


Для группы предприятий заданы значения признаков.

Для пары признаков Y и X1.

1. Рассчитать параметры линейного уравнения регрессии .

. Оценить регрессионное уравнение через среднюю ошибку аппроксимации, F-критерий Фишера, t-критерий Стьюдента, построить уравнение на корреляционном поле.

. Найти коэффициент корреляции, коэффициент детерминации.

. Выполнить прогноз признака Y при прогнозном значении X1 , составляющем 105% от среднего уровня, оценить точность прогноза по стандартной ошибке и доверительному интервалу.

. Определить с помощью коэффициентов эластичности силу влияния признака X1 на результирующий признак Y.


МНОЖЕСТВЕННАЯ РЕГРЕССИЯ


. Составить корреляционную матрицу, провести ее анализ.

. Найти коэффициенты множественной детерминации и корреляции, сделать вывод.

. Оставить в модели множественной регрессии две независимые переменные.

. Построить уравнение множественной регрессии по двум независимым переменным. Оценить точность модели. Проверить статистическую значимость уравнения множественной регрессии в целом. Найти коэффициенты множественной детерминации и корреляции.

. Построить частные уравнения множественной регрессии.

. Найти средние по совокупности и частные коэффициенты эластичности. Провести сравнительный анализ.

Результаты анализа оформить в виде аналитической записки.

Исходные данные. Вариант № 16


Y - рентабельность;

Х1 - премии и вознаграждения на одного работника;

Х2 - фондоотдача;

Х3 - оборачиваемость нормируемых оборотных средств;

Х4 - оборачиваемость ненормируемых оборотных средств;

Х5 - непроизводственные расходы.


№ предприятияРентабельностьПремии и вознаграждения на одного работникаФондоотдачаОборачиваемость нормируемых оборотных средствОборачиваемость ненормируемых оборотных средствнепроизводственные расходыnYX1X2X3X4X5113,261,231,45166,3210,0817,72210,161,041,392,8814,7618,39313,721,81,37158,046,4826,46412,850,431,6593,9621,9622,37510,630,881,91173,8811,8828,1369,120,571,68162,312,617,55725,831,721,9488,5611,5221,92823,391,71,89101,168,2819,52914,680,841,94166,3211,5223,991010,050,62,06140,7632,421,761113,990,821,96128,5211,5225,68129,680,841,02177,8417,2818,131310,030,671,85114,4816,225,74149,131,040,8893,2413,3221,21155,370,660,62126,7217,2822,97169,860,861,0991,89,7216,381712,620,791,669,1216,213,21185,020,341,5366,2424,8414,481921,181,61,467,6814,7613,382025,171,462,2250,47,5613,692119,41,271,3270,568,6416,6622211,581,48728,6415,06236,570,680,6897,2920,092414,190,862,380,2814,7615,982515,811,981,3751,4810,0818,27265,230,331,51105,1214,7614,42277,990,451,43128,5210,4422,762817,50,741,8294,6814,7615,412917,160,032,6285,3220,5219,353014,540,991,7576,3214,416,83316,240,241,5415324,8430,533212,080,572,25107,6411,1617,98339,491,221,0790,726,4822,09349,280,681,4482,449,7218,293511,4211,479,923,2426,053610,310,811,31120,966,4826,2378,651,271,1284,65,417,263810,941,141,1685,326,1218,83399,871,890,88101,528,6419,7406,140,671,07107,6411,8816,874112,930,961,2485,327,9214,63429,780,671,49131,7610,0822,174313,220,982,03116,6418,7222,624417,291,161,84138,2413,6826,44457,110,541,22156,9616,5622,264622,491,231,72137,5214,7619,134712,140,781,75135,727,9218,284815,251,161,46155,5218,3628,234931,344,441,648,68,2812,395011,561,061,4742,8414,0411,645130,142,131,38142,216,928,625219,711,211,41145,811,1620,15323,562,21,39120,5214,7619,41


Парная регрессия и корреляция


1. Построим уравнение парной линейной регрессии вида для пары переменных y, x1.

Параметры b0 и b1 уравнения линейной регрессии рассчитываются методом наименьших квадратов путем решения системы нормальных уравнений:



Для нахождения параметров b0 и b1 используем ППП «Анализ данных» MS Excel. Результаты расчетов приведены в приложении 1.

Уравнение регрессии имеет вид:


(1)


Рис. 1. Линия регрессии на корреляционном поле


. Оценка уравнения регрессии через среднюю ошибку аппроксимации и F-критерий Фишера, t-критерий Стьюдента.

Средняя относительная ошибка аппроксимации определяется по формуле:


.


Для вычисления составлена расчетная таблица (см. приложение 2).

= 47,839%

Т.к. значение средней относительной ошибки аппроксимации для уравнения находятся в пределах от 20% до 50%, уравнение имеет удовлетворительную точность.

Исследование статистической значимости уравнения регрессии в целом проводится с помощью F-критерия Фишера. Выдвинем гипотезу Н0 о том, что уравнение в целом статистически незначимо, при конкурирующей гипотезе Н1: уравнение в целом статистически значимо. Расчетное значение критерия находится по формуле:


.


Для парного уравнения p = 1.

Табличное (теоретическое) значение критерия находится по таблице критических значений распределения Фишера-Снедекора (в работе использована функция FРACПОБР (0,05;1;51)) по уровню значимости ?=0,05 и двум числам степеней свободы


k1 = p = 1 и k2 = n - p - 1 = 53 - 1 - 1 = 51.

.

Fрасч=54,73781 > Fтабл, (4)


гипотеза Н0 принимается, а уравнение линейной регрессии в целом считается статистически незначимо (с вероятностью ошибки 5%).

Проверка статистической значимости параметров b0, b1 с помощью t-критерия Стъюдента производится для статистически значимого линейного уравнения регрессии. В моём варианте уравнение линейной регрессии в целом статистически значимо. Проверим статистическую значимость оценок параметров b0, b1 с помощью t-критерия Стъюдента. Выдвигается гипотеза Н0: параметр bj = 0 (j = 0, 1) (статистически незначим, случайно отличается от 0), при конкурирующей гипотезе Н1: параметр bj ? 0 (статистически значим, неслучайно отличается от 0). Находится расчетное значение критерия

,


где средние квадратические ошибки параметров bj равны


,

.


Теоретическое значение критерия tтабл находится по таблице критических значений распределения Стъюдента (в работе использована функция СТЬЮДРACПОБР (0,05;51))по уровню значимости ?=0,05 и числу степеней свободы k = n - p - 1. Если tbj > tтабл , то гипотеза Н0 отвергается с вероятностью ошибки ? , т.е. оценка коэффициента регрессии bj признается статистически значимой, в противном случае (tbj < tтабл) - незначимой.

Табличное значение критерия для уровня значимости ?=0,05 и числа степеней свободы k = n - 2 = 51 равно.

Найдем доверительные интервалы для параметров b0 и b1 уравнения (1).

?b0= tтабл·mb0=2,008·6,545=13,142;

?b1 = tтабл·mb1 =2,008·6,702=13,458.

Сами доверительные интервалы имеют вид:


;

.


Результаты расчетов (см. приложения 1) приведены в таблице 1.


Таблица 1. Проверка критерия Стъюдента

Уравнение регрессии Параметр уравнения bjСреднеквадратическая ошибка параметра Расчетное значение критерия Табличное значение критерия tтаблВывод о статистической значимостиГраницы доверительных интерваловлеваяправаяb0=6,5151,1455,6912,008значим4,2178,814b1=6,7020,9067,399незначим4,8848,521

Доверительный интервал для параметра b1 имеет одинаковые знаки, что подтверждает вывод критерия Стьюдента о его статистической значимости.

. Коэффициент корреляции находится по формуле:


уравнение регрессия детерминация корреляция

Из таблицы «Вывод итогов» (см. приложение 1)

. Следовательно, между показателями y и x1 имеется линейная связь.

Коэффициент детерминации для пары признаков y и x1:


.


Т.е. всего 0,03% изменчивости y объясняется показателем x1, остальная доля приходятся на неучтённые в модели независимые переменные.

. Найдем прогнозное значение yпр путем подстановки значения x1пр в уравнение регрессии (105% от среднего уровня ср.Х1=1,0719)

xпр = 1,072*1,05 = 1,125

Стандартную ошибку прогноза найдем по формуле



= 7,16

Доверительный интервал прогнозного значения имеет вид


или (5,11; 23,007).


Результаты расчетов приведены в приложении 2.

. Определим с помощью коэффициентов эластичности силу влияния признаков xj на результирующий признак y.

Для парного линейного уравнения регрессии средний коэффициент эластичности находится по формуле:



Для признаков y и x1 уравнение регрессии имеет вид

, Х1ср=1,0719.

Фактор «Удельный вес покупных изделий» (X1) оказывает влияние на величину производительности труда (Y): при его росте на 1% рентабельность увеличивается в среднем на 0,509%.

Частные коэффициенты эластичности находятся по формулам


.


Расчеты эластичности приведены в итоговой таблице 2.

№ предприятияХ1 - премии и вознаграждения на одного работникаЧастный коэффициент эластичности Э111,230,5621,040,5231,80,6540,430,3150,880,4860,570,3771,720,6481,70,6490,840,46100,60,38110,820,46120,840,46130,670,41141,040,52150,660,40160,860,47170,790,45180,340,26191,60,62201,460,60211,270,57221,580,62230,680,41240,860,47251,980,67260,330,25270,450,32280,740,43290,030,03300,990,50310,240,20320,570,37331,220,56340,680,413510,51360,810,45371,270,57381,140,54391,890,66400,670,41410,960,50420,670,41430,980,50441,160,54450,540,36461,230,56470,780,45481,160,54494,440,82501,060,52512,130,69521,210,55532,20,69Средний коэффициент эластичности 0,49

Множественная регрессия


. Составить корреляционную матрицу, провести ее анализ. Исследовать интеркорреляцию переменных.

Элементами данной матрицы являются коэффициенты парной корреляции. Элементы, стоящие на главной диагонали, равны 1. Следовательно:



Элементы, стоящие симметрично относительно главной диагонали, равны.



Расчеты проводились с помощью ППП «Анализ данных» MS Excel. Корреляционная матрица имеет вид:


YX1X2X3X4X5Y1X10,7194961X20,365277-0,1114462271X3-0,202637-0,259423713-0,0073111X4-0,145227-0,3611359570,2701230,21054951X5-0,3297-0,2892964980,0373620,5489450,072861

Анализ корреляционной матрицы показывает, что независимые переменные в основном слабо связаны между собой (коэффициенты межфакторной корреляции по абсолютному значению меньше 0,7), связь средней силы наблюдается только между факторами х3 и х5. С результативным показателем y сильная связь наблюдается только с фактором х1, с остальными факторами связь слабая.

. Найти коэффициенты множественной детерминации и корреляции, сделать вывод.

Коэффициент множественной детерминации найдем по формуле


.


Коэффициент множественной детерминации показывает, что изменение значений y на 74% объясняется признаками x1, x2, x3, x4, x5.

Коэффициент множественной корреляции равен:



Коэффициент множественной корреляции, равный 0,86, свидетельствует о том, что между y и факторами x1, x2, x3, x4, x5 существует сильная регрессионная связь.

. Оставить в модели множественной регрессии две независимые переменные.

Как показывает анализ корреляционной матрицы, факторы, за исключением х1, оказывают слабое влияние на результирующий фактор Y. Исходя из требования независимости переменных, мы оставляем в модели независимые переменные х1 и х2.

Таким образом, в уравнении множественной линейной регрессии остаются только две объясняющие переменные: х1 и х2.

. Построить уравнение множественной регрессии по двум независимым переменным. Оценить точность модели. Проверить статистическую значимость уравнения множественной регрессии в целом. Найти коэффициенты множественной детерминации и корреляции.

Уравнение множественной линейной регрессии по двум объясняющим переменным имеет вид


,


(см. приложение 3)

Средняя относительная ошибка аппроксимации равна


,


расчёты приведены в таблице (см. приложение 4).

Т.к. значение средней относительной ошибки аппроксимации для уравнения > 12%, уравнениe не даёт хорошую точность.

Коэффициент множественной детерминации равен

.

Коэффициент множественной детерминации показывает, что изменение значений Y на 71% объясняется признаками х1 и х2.

Коэффициент множественной корреляции будет равен:



Коэффициент множественной корреляции, равный 0.84, показывает, что связь между показателями сильная.

Исследуем статистическую значимость уравнения множественной регрессии в целом, используя F-критерий Фишера.



?=0,05

k1=m=2=n-m-1=50

Поскольку Fрасч>Fтабл, уравнение множественной регрессии в целом является статистически значимым.

. Построить частные уравнения множественной регрессии.

На основе линейного уравнения множественной регрессии



можно построить частные уравнения регрессии. Эти уравнения имеют вид


;

.


После приведения подобных уравнения принимают вид парных уравнений линейной регрессии


;

.


В нашем случае

Или


.


7. Найти средние по совокупности и частные коэффициенты эластичности. Провести сравнительный анализ.

Средние по совокупности коэффициенты эластичности находятся по формуле


, j = 1,2.


Частные коэффициенты эластичности равны


;

.


Результаты расчетов приведены в таблице 3.


Таблица 3

№ предприятияYX1X2Yпр.x1x2Yпр.x2x1Эxi1Эxi2113,261,231,4514,8313,170,590,77210,161,041,313,4712,120,550,75313,721,81,3718,9212,610,680,76412,850,431,659,1014,560,340,79510,630,881,9112,3216,370,510,8169,120,571,6810,1014,770,400,79725,831,721,9418,3516,580,670,81823,391,71,8918,2016,230,670,81914,680,841,9412,0416,580,500,811010,050,62,0610,3217,420,420,821113,990,821,9611,8916,720,490,82129,680,841,0212,0410,170,500,701310,030,671,8510,8215,960,440,81149,131,040,8813,479,200,550,67155,370,660,6210,757,390,440,58169,860,861,0912,1810,660,510,711712,620,791,611,6814,210,490,78185,020,341,538,4513,730,290,781921,181,61,417,4912,820,660,762025,171,462,2216,4818,530,640,832119,41,271,3215,1212,260,600,7522211,581,4817,3413,380,650,77236,570,680,6810,897,810,450,612414,190,862,312,1819,090,510,842515,811,981,3720,2112,610,700,76265,230,331,518,3813,590,280,77277,990,451,439,2413,030,350,762817,50,741,8211,3215,750,470,812917,160,032,626,2321,320,030,863014,540,991,7513,1115,260,540,80316,240,241,547,7313,800,220,783212,080,572,2510,1018,740,400,84339,491,221,0714,7610,520,590,71349,280,681,4410,8913,100,450,773511,4211,413,1812,820,540,763610,310,811,3111,8212,190,490,75378,651,271,1215,1210,870,600,723810,941,141,1614,1911,150,580,72399,871,890,8819,579,200,690,67406,140,671,0710,8210,520,440,714112,930,961,2412,9011,710,530,74429,780,671,4910,8213,450,440,774313,220,982,0313,0417,210,540,824417,291,161,8414,3315,890,580,81457,110,541,229,8911,570,390,734622,491,231,7214,8315,050,590,804712,140,781,7511,6115,260,480,804815,251,161,4614,3313,240,580,774931,344,441,637,8514,210,840,785011,561,061,4713,6113,310,560,775130,142,131,3821,2912,680,720,765219,711,211,4114,6912,890,590,765323,562,21,3921,7912,750,720,76Средние по совокупности коэффициенты эластичности 0,520,77

Расчёты по двум выбранным признакам показывают, что при изменении х1 на 1%, y, в среднем, изменяется на 0,52%, при изменении х2 на 1%, y, в среднем, изменяется на 0,77%.



Приложение 1


ВЫВОД ИТОГОВРегрессионная статистикаМножественный R0,719496289R-квадрат0,51767491Нормированный R-квадрат0,508217555Стандартная ошибка4,415816543Наблюдения53Дисперсионный анализ dfSSMSFЗначимость FРегрессия11067,356461067,3564654,737812661,27887E-09Остаток51994,471222719,49943574Итого522061,827683 КоэффициентыСтандартная ошибкаt-статистикаP-ЗначениеНижние 95%Верхние 95%Y-пересечение6,5154439911,1448872875,6909043046,22892E-074,2169869028,81390108X16,7021909610,905885027,3985007031,27887E-094,8835509348,520830987

Приложение 2


Расчетная таблица

№ предприятияX1YYпр.(Y-Yпр.)Abs((Y-Yпр.)/Y)(Y-Yпр.)2(Xi -Xср.)211,2313,2614,76-1,500,112,250,02521,0410,1613,49-3,330,3311,060,00131,813,7218,58-4,860,3523,610,53040,4312,859,403,450,2711,920,41250,8810,6312,41-1,780,173,180,03760,579,1210,34-1,220,131,480,25271,7225,8318,047,790,3060,630,42081,723,3917,915,480,2330,040,39590,8414,6812,152,530,176,420,054100,610,0510,54-0,490,050,240,223110,8213,9912,011,980,143,920,063120,849,6812,15-2,470,256,080,054130,6710,0311,01-0,980,100,950,162141,049,1313,49-4,360,4818,970,001150,665,3710,94-5,571,0431,010,170160,869,8612,28-2,420,255,850,045170,7912,6211,810,810,060,660,079180,345,028,79-3,770,7514,240,536191,621,1817,243,940,1915,530,279201,4625,1716,308,870,3578,670,151211,2719,415,034,370,2319,120,039221,582117,103,900,1915,170,258230,686,5711,07-4,500,6920,280,154240,8614,1912,281,910,133,650,045251,9815,8119,79-3,980,2515,810,825260,335,238,73-3,500,6712,230,550270,457,999,53-1,540,192,380,387280,7417,511,486,020,3436,300,110290,0317,166,7210,440,61109,071,086300,9914,5413,151,390,101,930,007310,246,248,12-1,880,303,550,692320,5712,0810,341,740,143,040,252331,229,4914,69-5,200,5527,060,022340,689,2811,07-1,790,193,210,15435111,4213,22-1,800,163,230,005360,8110,3111,94-1,630,162,670,069371,278,6515,03-6,380,7440,670,039381,1410,9414,16-3,220,2910,340,005391,899,8719,18-9,310,9486,720,669400,676,1411,01-4,870,7923,680,162410,9612,9312,95-0,020,000,000,013420,679,7811,01-1,230,131,500,162430,9813,2213,080,140,010,020,008441,1617,2914,293,000,179,000,008450,547,1110,13-3,020,439,150,283461,2322,4914,767,730,3459,770,025470,7812,1411,740,400,030,160,085481,1615,2514,290,960,060,920,008494,4431,3436,27-4,930,1624,3411,344501,0611,5613,62-2,060,184,240,000512,1330,1420,799,350,3187,401,120521,2119,7114,635,080,2625,860,019532,223,5621,262,300,105,291,273Сумма 726,07726,07 15,57994,4723,762Среднее значение1,071913,699413,6994 0,29418,764 Х пр./Yпр.1,125514,059 Средняя относительная ошибка аппроксимации29% myпр.4,458

Приложение 3


ВЫВОД ИТОГОВ - по 2-м переменнымРегрессионная статистикаМножественный R0,84770707R-квадрат0,718607277Нормированный R-квадрат0,707351568Стандартная ошибка3,406415436Наблюдения53Дисперсионный анализ dfSSMSFЗначимость FРегрессия21481,644377740,822188563,843804251,70931E-14Остаток50580,183306111,60366612Итого522061,827683 КоэффициентыСтандартная ошибкаt-статистикаP-ЗначениеНижние 95%Верхние 95%Y-пересечение-4,6167985292,061804193-2,2392031910,029621902-8,758054045-0,47554301X17,1704567960,70319145210,197019298,30442E-145,7580552268,582858366X26,9659578571,1658087795,9752147872,39183E-074,6243620579,307553657


Приложение 4


Расчётная таблица (множественная регрессия)

№ предприятияYX1X2Yпр.Abs((Y-Yпр.)/Y)113,261,231,4514,300,08210,161,041,311,900,17313,721,81,3717,830,30412,850,431,659,960,22510,630,881,9115,000,4169,120,571,6811,170,23725,831,721,9421,230,18823,391,71,8920,740,11914,680,841,9414,920,021010,050,62,0614,040,401113,990,821,9614,920,07129,680,841,028,510,121310,030,671,8513,070,30149,131,040,888,970,02155,370,660,624,430,17169,860,861,099,140,071712,620,791,612,190,03185,020,341,538,480,691921,181,61,416,610,222025,171,462,2221,320,152119,41,271,3213,680,2922211,581,4817,020,19236,570,680,685,000,242414,190,862,317,570,242515,811,981,3719,120,21265,230,331,518,270,58277,990,451,438,570,072817,50,741,8213,370,242917,160,032,6213,850,193014,540,991,7514,670,01316,240,241,547,830,263212,080,572,2515,140,25339,491,221,0711,580,22349,280,681,4410,290,113511,4211,412,310,083610,310,811,3110,320,00378,651,271,1212,290,423810,941,141,1611,640,06399,871,890,8815,070,53406,140,671,077,640,244112,930,961,2410,900,16429,780,671,4910,570,084313,220,982,0316,550,254417,291,161,8416,520,04457,110,541,227,750,094622,491,231,7216,180,284712,140,781,7513,170,084815,251,161,4613,870,094931,344,441,638,370,225011,561,061,4713,220,145130,142,131,3820,270,335219,711,211,4113,880,305323,562,21,3920,840,12Сумма 10,58Средняя относительная ошибка аппроксимации (%)20,0


МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ПУТЕЙ СООБЩЕНИЯ (МИИТ) ИНСТИТУТ ЭКОНОМИКИ И ФИНАНСОВ ВЫСШАЯ ТРАНСПОРТНАЯ БИЗНЕС-ШКОЛА ПРОГРАММА «Мас

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ