Классическая модель линейной регрессии

 

Лабораторная работа № 2


Тема "Классическая модель линейной регрессии"


Задания По данным приложения А:

1)рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2007 г.

2)дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.

)оцените с помощью F-критерия Фишера - Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.

)оцените статистическую значимость коэффициентов регрессии с помощью t - критерия Стьюдента.

)оцените качество уравнения через среднюю ошибку аппроксимации.

)рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.

)постройте модель в естественной форме только с информативными факторами и оцените ее параметры.

)постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.

9)рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.

10)рассчитайте ошибки и доверительный интервал прогноза для уровня значимости .

)по полученным результатам сделайте экономический вывод.

Реализация типовых заданий


1.Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2007 г.

Имеются данные о деятельности 25 крупнейших компаний США (таблица 8.2.1).

Построим уравнение множественной линейной регрессии следующего вида:


.


Для этого проведем регрессионный анализ данных факторов с помощью табличного редактора МС Excel.


Таблица 8.2.1 - Исходные данные для проведения корреляционного и регрессионного анализа

№ п/п145,9346812,543,32,3246,716,149,318,842,93,9345,77,266,6741,31,7446,712,717,314,640,92,6547,622,778,530,739,73,1646,317,720,92828,90,6749,1139,8356,4100,639,45,1846,620,672,424,839,22,6951,9168,1218,2216,138,74,51045,44,751,237,71,91146,39,528,87,837,731246,929,86812,437,43,61346,916,147,517,928,63,71446,412,545,461,535,52,51545,422,243,930,535,13,11645,89,511,59,734,50,31746,829,746,841,232,92,21845,915,124,827,832,23,51946,120,45440,627,84,12046,915,442,817,231,74,32144,124,15,83831,62,92246,316,23120,531,63,5234716,141,41931,542445,66,96,86,730,32,62545,718,220,923,429,64

где y - чистый доход, млрд. долл. x1 - оборот капитала, млрд. долл. x2 - использованный капитал, млрд. долл. x3 - численность служащих, тыс. чел. x4 - рыночная капитализация компаний, млрд. долл. x5 - заработная плата служащих, тыс. долл.

Для построения модели можно воспользоваться инструментом анализа данных Регрессия. Порядок действий следующий:

а) в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК;

б) заполните диалоговое окно ввода данных и параметров ввода (рисунок 8.2.1):


классическая модель линейная регрессия

Рисунок 8.2.1 - Диалоговое окно ввода параметров инструмента "Регрессия"


Входной интервал Y - диапазон, содержащий данные результативного признака;

Входной интервал Х - диапазон, содержащий данные всех пяти факторов;

Метки - флажок, который указывает, содержит ли первая строка названия столбцов или нет;

Константа - ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении;

Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона;

Новый рабочий лист - можно задать произвольное имя нового листа.

Результаты регрессионного анализа представлены на рисунке 8.2.2.


Рисунок 8.2.2 - Результат применения инструмента Регрессия для факторов


Составим уравнение множественной регрессии:


.


Коэффициенты регрессии показывают среднее изменение результативного признака с изменением на 1 единицу своего измерения данного фактора при условии постоянства всех остальных.

Таким образом, коэффициент регрессии при х1 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,0136 млрд. долл., при х2 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,003 млрд. долл., х3 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,012 тыс. чел., х4 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,025 млрд. долл., х5 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,07 тыс. долл., при фиксированном значении остальных факторов.

Параметр экономического смысла не имеет.

2. Дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.

Средние коэффициенты эластичности показывают, на сколько процентов от значения своей средней изменяется результат при изменении фактора на 1 % от своей средней и при фиксированном воздействии на y всех прочих факторов, включенных в уравнение регрессии. Для линейной зависимости


,


где - коэффициент регрессии при в уравнении множественной регрессии.

Результаты вычисления соответствующих показателей для каждого признака представлены на рисунке 8.2.3.


Рисунок 8.2.3 - Результат применения инструмента "Описательная статистика"


Здесь ,

,

,

,

.


По значениям средних коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат y признаков факторов и , чем признаков факторов , и .

Средний коэффициент эластичности , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,008 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,003 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,009 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,019 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,005 %, при условии, что другие факторы остаются постоянными.

3. Оцените с помощью F-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.

Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает F-критерий Фишера:


.


Для проверки значимости уравнения выдвигаем две гипотезы:

Н0: уравнение регрессии статистически не значимо;

Н1: уравнение регрессии статистически значимо.

По данным таблиц дисперсионного анализа, представленным на рисунке 8.2.2, =11.52. Вероятность случайно получить такое значение F-критерия составляет 0,00003, что не превышает допустимый уровень значимости 5 %; об этом свидетельствует величина P - значение из этой же таблицы. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи . =0,00003. > следовательно уравнение регрессии является статистически значимым.

4.Оцените статистическую значимость коэффициентов регрессии с помощью t - критерия Стьюдента.

Выдвигаем две гипотезы: Н0: коэффициенты регрессии статистически не значим, т.е. равны о; Н1: коэффициенты регрессии статистически значимы, т.е. отличны от нуля. Значения случайных ошибок параметров с учетом округления равны (рисунок 8.2.2):



Они показывают, какое значение данной характеристики сформировались под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента (рисунок 8.2.2):


.


Если значения t-критерия меньше 2,09, можно сделать вывод о неслучайной природе данного значения параметра, т. е о том, что он статистически значим и надежен. Tтабл=

5. Оцените качество уравнения через среднюю ошибку аппроксимации.

Рассчитаем среднюю ошибку аппроксимации по формуле средней арифметической простой:



Таблица 8.2.2 - Данные для расчета средней ошибки аппроксимации

№ п/п1234145,946,581,48246,746,460,52345,746,050,77446,746,121,23547,646,642,01646,345,920,81749,150,041,91846,646,480,26951,951,341,091045,445,690,641146,346,821,131246,946,470,931346,946,071,771446,446,630,491545,446,412,231645,845,680,251746,846,540,571845,946,180,621946,146,430,712046,946,161,582144,146,365,122246,346,110,40234746,161,792445,645,650,122545,746,130,941164,001165,1329,38


Таким образом, фактические значения результативного признака отличаются от теоретических значений на 117,5 %. Следовательно, построенная модель не является удовлетворительной.

i.Рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.

Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.

Парные коэффициенты корреляции рассчитываются по формулам:


; .


Рисунок 8.2.4 - Матрица коэффициентов парной корреляции


Из матрицы можно заметить, что факторы и , и мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,7. Таким образом, можно сказать, что они дублируют друг друга.

При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В нашем примере получаем, информативными факторами являются: и .

Построим новое уравнение множественной регрессии с информативными факторами.

7. Постройте модель в естественной форме только с информативными факторами и оцените ее параметры.

Построим уравнение множественной линейной регрессии следующего вида:


.


Параметры вычисляем аналогично пункту 1 (рисунок 8.2.7).


Рисунок 8.2.7 - Результат применения инструмента "Регрессия"


Получаем уравнение следующего вида: .

Уравнение в целом, а также его параметры являются статистически значимыми.

8. Постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.

Уравнение в стандартизованном масштабе имеет вид:


.


Расчет ? - коэффициентов выполним по формулам


; .


Парные коэффициенты корреляции берутся из матрицы (рисунок 8.2.6):



Получим уравнение .

Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результативный признак, если соответствующий фактор изменится на 1 сигму при неизменном среднем уровне других факторов.

В нашем случае, при увеличении использования капитала на 1 сигму чистый доход увеличится на 1,07 сигм, при условии, что численность служащих остаются на прежнем уровне, при увеличении использования капитала на 1 сигму чистый доход уменьшится на 0,46 сигм, при условии, что численность служащих остаются на прежнем уровне.

9. Рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.

Рассчитаем ожидаемое прогнозное значение чистого дохода как точечный прогноз путем подстановки в уравнение регрессии прогнозные значения факторов:

1)найдем максимальное значение для фактора (рисунок 8.2.4):

)найдем максимальное значение для фактора (рисунок 8.2.4):

)найдем прогнозные значения факторов:


для фактора :

для фактора :


4)подставим прогнозные значения факторов в уравнение



В результате получим:



Таким образом, при прогнозных значениях использованного капитала 356 млдр. долл. и численности служащих 216,1 тыс. чел. чистый доход крупнейших компаний США составит 92,21 млрд. долл.


Лабораторная работа № 2 Тема "Классическая модель линейной регрессии" Задания По данным приложения А: 1)рассчитайте параметры линейно

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ