Прикладная статистика и основы эконометрики

 

Задача 16


Зависимость меду величинами x и y описывается функцией y = f(x, a, b), где a и b - неизвестные параметры. Найти эти параметры, сведя исходную задачу к линейной задаче метода наименьших квадратов (Линейной регрессии).



ХY0,51,98130,62,28090,72,31820,82,83580,92,896213,24251,13,99181,24,64591,36,09381,47,65871,510,8872

Оценить полученную точность аппроксимации.

Решение.

Сведем исходную задачу к линейной задаче МНК, для этого сделаем подходящую замену переменных.

Так как исходная зависимость имеет вид , то прологарифмировав исходное неравенство и введя новые переменные:


= х3; A = lna; lny = s


Получаем задачу об определении коэффициентов линейной зависимости s = A + bt.

Рассчитаем параметры A и b уравнения линейной регрессии s = A + b·t. Для расчетов заполним таблицу.


№п/пХYtsstt210,51,98130,1250,6840,0850,0162,1390990,07964420,62,28090,2160,8250,1780,0472,2382690,01869130,72,31820,3430,8410,2880,1182,3844030,02855840,82,83580,5121,0420,5340,2622,5937660,0853550,92,89620,7291,0630,7750,5312,8897690,00222613,242511,1761,1761,0003,3073090,01998771,13,99181,3311,3841,8421,7723,8999850,02300181,24,64591,7281,5362,6542,9864,7525380,02295391,36,09382,1971,8073,9714,8276,0028880,014919101,47,65872,7442,0365,5867,5307,8825130,029223111,510,8873,3752,3888,05811,39110,792860,008665Итого1148,83214,314,78225,14930,4780,333Среднее14,4391,31,3442,2862,771


- линейное уравнение регрессии

Можно было воспользоваться MS Excel, Анализ данных - Регрессия

.

ВЫВОД ИТОГОВРегрессионная статистикаМножественный R0,997054R-квадрат0,994116Нормированный R-квадрат0,993462Стандартная ошибка0,044122Наблюдения11Дисперсионный анализ dfSSMSFЗначимость FРегрессия12,9601042,9601041520,532,38E-11Остаток90,0175210,001947Итого102,977625 Коэффициен-тыСтандартная ошибкаt-статистикаP-ЗначениеНижние 95%Верхние 95%Y-пересечение0,6951310,02130132,633881,17E-100,6469450,743317Переменная X 10,4989980,01279738,993982,38E-110,4700490,527946

Перейдем обратно к начальным данным:


A = lna; следовательно,


Получим:

Оценим полученную точность аппроксимации.



Так как полученная точность менее 5%, то модель достаточно точная.


Задача 2.16. Построение однофакторной регрессии


Имеются данные по цене некоторого блага (Х) и количеству (Y) данного блага, приобретаемого домохозяйством ежемесячно в течении года.

Предполагается, что генеральное уравнение регрессии - линейное.


Цена, Х10201525303540Приобретаемое количество, Y1107510080605540

. Найти оценки коэффициентов регрессии b0 и b1.

. С надежностью 0,9 определить интервальные оценки теоретических коэффициентов регрессии.

. Определить коэффициент детерминации и сделать соответствующие выводы о качестве уравнения регрессии.

. С доверительной вероятностью 0,05 определить интервальную оценку условного математического ожидания Y при Х = 23.

Решение.

Найти оценки коэффициентов регрессии b0 и b1.

Генеральное уравнение регрессии - линейное: .


№ п/пXYХ2XY1101101001100220754001500315100225150042580625200053060900180063555122519257404016001600Итого175520507511425Среднее2574,285717251632,143


2. С надежностью 0,9 определим интервальные оценки теоретических коэффициентов регрессии.

Для уровня значимости a=0,1 и числа степеней свободы k = n - 2 = 7 - 2 = = 5 критерий Стьюдента равен .

Дисперсии средние квадратичные отклонения коэффициентов и уравнения регрессии определим из равенств:



Для определения математической значимости коэффициентов b0 и b1 найдем t - статистику Стьюдента:


;


Сравнение расчетных и табличных величин критерия Стьюдента показывает, что или и или 9,987 > 2,5706, т.е. с надежностью 0,9 оценка b0 теоретического коэффициента регрессии b0 значима, оценка b1 теоретического коэффициента регрессии b1 значима.

Доверительные интервалы для этих коэффициентов равны:


Подставив числовые значения, значения коэффициентов b0 и b1, их средние квадратичные отклонения и значение для t имеем:



Одинаковые по знаку значения верхней и нижней границ измерений коэффициента b0 и b1 свидетельствует о его статистической значимости.

. Определим коэффициент детерминации и сделаем соответствующие выводы о качестве уравнения регрессии.

Для определения коэффициента детерминации воспользуемся результатами расчетов.

По таблице 1 найдем:

общую ошибку:



ошибку объясняемую регрессией



остаточную ошибку


Причем имеем TSS = RSS + ESS

Тогда коэффициент детерминации равен



Полученная величина коэффициента детерминации свидетельствует о том, что необъясненная ошибка составляет около 95,23% от общей ошибки. Уравнение качественное.

. С доверительной вероятностью 0,05 определим интервальную оценку условного математического ожидания Y при Х = 23.

Дисперсия математического ожидания прогнозируемой величины yp равна



Среднее квадратичное отклонение математического ожидания прогнозируемой величины равно



С уровнем значимости a=0,05 доверительный интервал для условного математического ожидания yp при данном xp равен:


или .

Задача 3.16. Построение и анализ множественной регрессии


По данным, представленным в таблице, изучается зависимость средней ожидаемой продолжительности жизни (лет) Y от переменных: Х1 - ВВП в паритетах покупательской способности; Х2 - темпы прироста населения по сравнению с предыдущим годом, %; Х3 - темпы прироста рабочей силы по сравнению с предыдущим годом, %; Х4 - коэффициент младенческой смертности, %.


СтранаYX1X2X3X4Мозамбик4732,62,4113Бурунди492,32,62,798Чад482,62,52,5117Непал554,32,52,491Буркина-Фасо492,92,82,199Мадагаскар522,43,13,189Бангладеш585,11,62,179Гаити573,421,772Мали5022,92,7123Нигерия534,52,92,880Кения585,12,72,758Того564,232,888Индия625,21,8268Бенин506,52,92,595Никарагуа687,43,1446Гана597,42,82,773Ангола474,93,12,8124Пакистан608,32,93,390Мавритания515,72,52,796Зимбабве577,52,42,255Гондурас67733,845Китай6910,81,11,134Камерун577,82,93,156Конго517,62,92,690Шри-Ланка7212,11,3216Египед6314,222,756Индонезия6414,11,62,551Филлипины6610,62,22,739Марокко6512,422,655Папуа-Новая Гвинея5792,32,364Гватемала6612,42,93,544Эквадор6915,62,23,236Доминиканская Республика7114,31,92,637Ямайка7413,111,813Алдир7019,62,24,134Республика Эль-Сальвадор679,72,23,436Парагвай6813,52,72,941Тунис6918,51,9339Белоруссия7015,60,20,213Перу661423,147Тайланд69280,91,335Панама7322,21,72,423Турция6720,71,72,148Польша70200,30,614Словакия7213,40,30,711Венесуэла7129,32,3323ЮАР6418,62,22,450Мексика7223,71,92,833Мавритания71491,31,816Бразилия67201,51,644Тринидад7231,90,81,813Малайзия7133,42,42,712Чили7235,31,52,112Уругвай7324,60,6118Аргентина7330,81,3222Греция7843,40,60,98Республика Корея7242,40,91,910Испания7753,80,217Новая Зеландия7660,61,41,57Ирланлия7758,10,51,76Израиль7761,13,53,58Австралия7770,21,11,46Италия7873,70,20,47Канада7878,31,316Финляндия7665,80,50,15Гонконг7985,11,61,35Швеция7968,70,60,34Нидерланды7873,90,70,66Бельгия7780,30,40,58Франция78780,50,86Сингапур7684,421,74Автрия7778,80,80,56США7710011,18Дания7578,70,306Япония80820,30,64Швейцария7895,610,86

. Постройте матрицу парных коэффициентов корреляции. Установите, какие факторы коллинеарны.

. Постройте уравнение множественной регрессии, обосновав отбор факторов.

. Проведите тестирование ошибок уравнения множественной регрессии на гетероскедатичность, применив тест Гельфельда-Квандта.

. Оцените статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней продолжительности жизни в этом уравнении?

. Постройте уравнение множественной регрессии со статистически значимыми факторами.

Решение.

Воспользуемся MS Excel.

. Построим матрицу парных коэффициентов корреляции. Установим, какие факторы коллинеарны.


Сервис - Анализ данных - Корреляция

YX1X2X3X4Y1X10,7803231X2-0,72516-0,622591X3-0,53368-0,658270,8737781X4-0,96876-0,743430,7360730,5536031

Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. средняя ожидаемая продолжительность жизни, имеет тесную связь с коэффициентом младенческой смертности (ryx4=-0,969), с ВВП в паритетах покупательской способности (ryx1=0,780), с темпами прироста населения (ryx2=0,725). Однако факторы Х2 и Х3 тесно связаны между собой (rx2x3=0,874) и факторы Х2 и Х4 также тесно связаны (rx2x4=0,736), что свидетельствует о наличии коллинеарности.

Коллинеарность - зависимость между факторами. В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:


r(xjy) > r(xkxj) ; r(xky) > r(xkxj).


Коллинеарны факторы х2 и х3, х2 и х4, а также х3 и х4.

. Построим уравнение множественной регрессии, обосновав отбор факторов.

Из модели исключим фактор х3, так как зависимая переменная слабо зависит от этого фактора и чтобы исключить мультиколлинеарность.


Сервис - Анализ данных - Регрессия

ВЫВОД ИТОГОВРегрессионная статистикаМножественный R0,972926R-квадрат0,946586Нормированный R-квадрат0,94436Стандартная ошибка2,267593Наблюдения76Дисперсионный анализ dfSSMSFЗначимость FРегрессия36560,9362186,979425,31861,05E-45Остаток72370,22235,141977Итого756931,158 КоэффициентыСтандартная ошибкаt-статистикаP-ЗначениеНижние 95%Верхние 95%Y-пересечение75,438220,99863275,541592,59E-7073,4474977,42896X10,0446950,013813,2364160,001830,0171650,072225X2-0,04520,421364-0,107270,91487-0,885180,794772X4-0,239560,013205-18,14091,45E-28-0,26588-0,21323

Уравнение множественной регрессии:


y = 75,438 + 0,045x1 - 0,045x2 - 0,239x4


. Проведем тестирование ошибок уравнения множественной регрессии на гетероскедатичность, применив тест Гельфельда-Квандта.

Упорядочим по возрастанию значения переменной, затем исключим С центральных наблюдений, при этом (n - C)/2 > p, где р - число оцениваемых параметров, затем разделим совокупность на две группы и определим в каждой группе остаточные суммы S1 и S2 и находим их отношение R.

Гетероскедатичность по Y:

Критерий Табличное значение F-критерия

,75 > 3,9685

Гетероскедатичность по X1:

Критерий Табличное значение F-критерия

,08 > 3,9685

Гетероскедатичность по X2:

Критерий Табличное значение F-критерия

,59 > 3,9685

Гетероскедатичность по X4:

Критерий Табличное значение F-критерия

,540 > 3,9685

Все значения больше табличного значения F-критерия, следовательно, дисперсии остаточных величин не равны.

. Оценим статистическую значимость уравнения множественной регрессии. Какие факторы значимо воздействуют на формирование средней продолжительности жизни в этом уравнении?табл = 3,9685

Так как F = 425,3 (см таблицу Вывод итогов) > Fтабл., то уравнение множественной регрессии статистически значимо.

Коэффициент Стьюдента при n = 77 и уровне значимости 0,05 равен t(77; 0,05) = 1,9921.

Так как расчетные значения коэффициентов t, меньше чем табличное только для фактора х2, следовательно фактор х2 - не значим, факторы х1 и х4 - значимы.

. Построим уравнение множественной регрессии со статистически значимыми факторами.

Построим уравнение с факторами х1 и х4.


ВЫВОД ИТОГОВРегрессионная статистикаМножественный R0,972922R-квадрат0,946577Нормированный R-квадрат0,945114Стандартная ошибка2,252188Наблюдения76

Дисперсионный анализ dfSSMSFЗначимость FРегрессия26560,8763280,438203646,72957173,6476E-47Остаток73370,28155,072349165Итого756931,158 КоэффициентыСтандартная ошибкаt-статистикаP-ЗначениеНижние 95%Верхние 95%Y-пересечение75,381840,84334689,384252912,48751E-7673,7010526577,06262X10,0449420,0135253,3229177290,0013945180,0179869260,071897X4-0,24030,011187-21,480609312,77613E-33-0,262593269-0,218= 75,382 + 0,045Х1 - 0,240Х4.


Список используемой литературы

регрессия аппроксимация дисперсия уравнение

Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. - М.ЮНИТИ, 1998. - 1022 с.

Бородич С.А. Эконометрика: Учеб. пособие. - Мн.: Новое знание, 2001. - 408 с.

Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. Проф. Н.Ш. Кремера. - М.: ЮНИТИ-ДАНА, 2002. - 311 с.

Кулинич Е.И. Эконометрия. - М.: Финансы и статистика, 2001. - 304 с.

Орлов А.И. Эконометрика: Учебное пособие для вузов / А.И. Орлов - М.: Экзамен, 2002. - 576 с.


Задача 16 Зависимость меду величинами x и y описывается функцией y = f(x, a, b), где a и b - неизвестные параметры. Найти эти параметры, сведя исходную з

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2019 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ