Классическая модель линейной регрессии
Лабораторная работа № 2
Тема "Классическая модель линейной регрессии"
Задания По данным приложения А:
1)рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2007 г.
2)дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.
)оцените с помощью F-критерия Фишера - Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.
)оцените статистическую значимость коэффициентов регрессии с помощью t - критерия Стьюдента.
)оцените качество уравнения через среднюю ошибку аппроксимации.
)рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.
)постройте модель в естественной форме только с информативными факторами и оцените ее параметры.
)постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.
9)рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.
10)рассчитайте ошибки и доверительный интервал прогноза для уровня значимости .
)по полученным результатам сделайте экономический вывод.
Реализация типовых заданий
1.Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2007 г.
Имеются данные о деятельности 25 крупнейших компаний США (таблица 8.2.1).
Построим уравнение множественной линейной регрессии следующего вида:
.
Для этого проведем регрессионный анализ данных факторов с помощью табличного редактора МС Excel.
Таблица 8.2.1 - Исходные данные для проведения корреляционного и регрессионного анализа
№ п/п145,9346812,543,32,3246,716,149,318,842,93,9345,77,266,6741,31,7446,712,717,314,640,92,6547,622,778,530,739,73,1646,317,720,92828,90,6749,1139,8356,4100,639,45,1846,620,672,424,839,22,6951,9168,1218,2216,138,74,51045,44,751,237,71,91146,39,528,87,837,731246,929,86812,437,43,61346,916,147,517,928,63,71446,412,545,461,535,52,51545,422,243,930,535,13,11645,89,511,59,734,50,31746,829,746,841,232,92,21845,915,124,827,832,23,51946,120,45440,627,84,12046,915,442,817,231,74,32144,124,15,83831,62,92246,316,23120,531,63,5234716,141,41931,542445,66,96,86,730,32,62545,718,220,923,429,64
где y - чистый доход, млрд. долл. x1 - оборот капитала, млрд. долл. x2 - использованный капитал, млрд. долл. x3 - численность служащих, тыс. чел. x4 - рыночная капитализация компаний, млрд. долл. x5 - заработная плата служащих, тыс. долл.
Для построения модели можно воспользоваться инструментом анализа данных Регрессия. Порядок действий следующий:
а) в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК;
б) заполните диалоговое окно ввода данных и параметров ввода (рисунок 8.2.1):
классическая модель линейная регрессия
Рисунок 8.2.1 - Диалоговое окно ввода параметров инструмента "Регрессия"
Входной интервал Y - диапазон, содержащий данные результативного признака;
Входной интервал Х - диапазон, содержащий данные всех пяти факторов;
Метки - флажок, который указывает, содержит ли первая строка названия столбцов или нет;
Константа - ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении;
Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона;
Новый рабочий лист - можно задать произвольное имя нового листа.
Результаты регрессионного анализа представлены на рисунке 8.2.2.
Рисунок 8.2.2 - Результат применения инструмента Регрессия для факторов
Составим уравнение множественной регрессии:
.
Коэффициенты регрессии показывают среднее изменение результативного признака с изменением на 1 единицу своего измерения данного фактора при условии постоянства всех остальных.
Таким образом, коэффициент регрессии при х1 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,0136 млрд. долл., при х2 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,003 млрд. долл., х3 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,012 тыс. чел., х4 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,025 млрд. долл., х5 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,07 тыс. долл., при фиксированном значении остальных факторов.
Параметр экономического смысла не имеет.
2. Дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.
Средние коэффициенты эластичности показывают, на сколько процентов от значения своей средней изменяется результат при изменении фактора на 1 % от своей средней и при фиксированном воздействии на y всех прочих факторов, включенных в уравнение регрессии. Для линейной зависимости
,
где - коэффициент регрессии при в уравнении множественной регрессии.
Результаты вычисления соответствующих показателей для каждого признака представлены на рисунке 8.2.3.
Рисунок 8.2.3 - Результат применения инструмента "Описательная статистика"
Здесь ,
,
,
,
.
По значениям средних коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат y признаков факторов и , чем признаков факторов , и .
Средний коэффициент эластичности , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,008 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,003 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,009 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,019 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,005 %, при условии, что другие факторы остаются постоянными.
3. Оцените с помощью F-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.
Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает F-критерий Фишера:
.
Для проверки значимости уравнения выдвигаем две гипотезы:
Н0: уравнение регрессии статистически не значимо;
Н1: уравнение регрессии статистически значимо.
По данным таблиц дисперсионного анализа, представленным на рисунке 8.2.2, =11.52. Вероятность случайно получить такое значение F-критерия составляет 0,00003, что не превышает допустимый уровень значимости 5 %; об этом свидетельствует величина P - значение из этой же таблицы. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи . =0,00003. > следовательно уравнение регрессии является статистически значимым.
4.Оцените статистическую значимость коэффициентов регрессии с помощью t - критерия Стьюдента.
Выдвигаем две гипотезы: Н0: коэффициенты регрессии статистически не значим, т.е. равны о; Н1: коэффициенты регрессии статистически значимы, т.е. отличны от нуля. Значения случайных ошибок параметров с учетом округления равны (рисунок 8.2.2):
Они показывают, какое значение данной характеристики сформировались под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента (рисунок 8.2.2):
.
Если значения t-критерия меньше 2,09, можно сделать вывод о неслучайной природе данного значения параметра, т. е о том, что он статистически значим и надежен. Tтабл=
5. Оцените качество уравнения через среднюю ошибку аппроксимации.
Рассчитаем среднюю ошибку аппроксимации по формуле средней арифметической простой:
Таблица 8.2.2 - Данные для расчета средней ошибки аппроксимации
№ п/п1234145,946,581,48246,746,460,52345,746,050,77446,746,121,23547,646,642,01646,345,920,81749,150,041,91846,646,480,26951,951,341,091045,445,690,641146,346,821,131246,946,470,931346,946,071,771446,446,630,491545,446,412,231645,845,680,251746,846,540,571845,946,180,621946,146,430,712046,946,161,582144,146,365,122246,346,110,40234746,161,792445,645,650,122545,746,130,941164,001165,1329,38
Таким образом, фактические значения результативного признака отличаются от теоретических значений на 117,5 %. Следовательно, построенная модель не является удовлетворительной.
i.Рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.
Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.
Парные коэффициенты корреляции рассчитываются по формулам:
; .
Рисунок 8.2.4 - Матрица коэффициентов парной корреляции
Из матрицы можно заметить, что факторы и , и мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,7. Таким образом, можно сказать, что они дублируют друг друга.
При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В нашем примере получаем, информативными факторами являются: и .
Построим новое уравнение множественной регрессии с информативными факторами.
7. Постройте модель в естественной форме только с информативными факторами и оцените ее параметры.
Построим уравнение множественной линейной регрессии следующего вида:
.
Параметры вычисляем аналогично пункту 1 (рисунок 8.2.7).
Рисунок 8.2.7 - Результат применения инструмента "Регрессия"
Получаем уравнение следующего вида: .
Уравнение в целом, а также его параметры являются статистически значимыми.
8. Постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.
Уравнение в стандартизованном масштабе имеет вид:
.
Расчет ? - коэффициентов выполним по формулам
; .
Парные коэффициенты корреляции берутся из матрицы (рисунок 8.2.6):
Получим уравнение .
Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результативный признак, если соответствующий фактор изменится на 1 сигму при неизменном среднем уровне других факторов.
В нашем случае, при увеличении использования капитала на 1 сигму чистый доход увеличится на 1,07 сигм, при условии, что численность служащих остаются на прежнем уровне, при увеличении использования капитала на 1 сигму чистый доход уменьшится на 0,46 сигм, при условии, что численность служащих остаются на прежнем уровне.
9. Рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.
Рассчитаем ожидаемое прогнозное значение чистого дохода как точечный прогноз путем подстановки в уравнение регрессии прогнозные значения факторов:
1)найдем максимальное значение для фактора (рисунок 8.2.4):
)найдем максимальное значение для фактора (рисунок 8.2.4):
)найдем прогнозные значения факторов:
для фактора :
для фактора :
4)подставим прогнозные значения факторов в уравнение
В результате получим:
Таким образом, при прогнозных значениях использованного капитала 356 млдр. долл. и численности служащих 216,1 тыс. чел. чистый доход крупнейших компаний США составит 92,21 млрд. долл.
Больше работ по теме:
Предмет: Эктеория
Тип работы: Практическое задание
Новости образования
КОНТАКТНЫЙ EMAIL: [email protected]
Скачать реферат © 2017 | Пользовательское соглашение
ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ