Особенности расчета статистических показателей

 

Задания


Имеются следующие выборочные данные по городам одного из регионов страны в отчетном периоде (выборка 10% -ная, механическая):


№ города п. /п. Товарооборот, млрд. руб. Численность населения, тыс. чел. № города п. /п. Товарооборот, млрд. руб. Численность населения, тыс. чел. 14,0050167,708624, 2060172,004537,9089187,008047,8088197,908954,1560207,608562,0045217,008674,0560225,307087,8087237,958994,5060246,3080105,0070259,80105114,0060269,051001210,00105279,60105137,9589283,9050146,0070292,1045157,9089309,70105

Задание 1


. Провести группировку единиц наблюдения статистической совокупности по факторному признаку, образовав четыре группы с равными интервалами. Построить аналитическую таблицу. Построить гистограмму и круговую диаграмму. Сделать выводы.

. По данным первоначальной и аналитической таблицы по факторной и результативной переменными расчетным путем (в форме расчетной таблицы) и с использованием статистических функций в Excel (в качестве проверки правильности расчета) определить и обосновать:

средние значения, моду и медиану. Сравнить их между собой и сделать соответствующие выводы.

показатели вариации (среднее линейное отклонение, дисперсию, среднеквадратическое отклонение, коэффициент вариации). Оценить исходную информацию на устойчивость и сделать выводы.


Решение задания 1


Первичные данные выборочной совокупности могут содержать аномальные значения изучаемых признаков. Выявим их и исключим из дальнейшего рассмотрения с целью обеспечения устойчивости данных статистического анализа.


№ города п. /п. Товарооборот, млрд. руб. Численность населения, тыс. чел. 145024,26037,98947,88854,1560624574,056087,88794,56010570114601210105137,958914670157,989167,7861724518780197,989207,68521786225,370237,9589246,380259,8105269,05100279,6105283,950292,145309,7105


Анализируя исходные табличные данные, видим, что в данной выборке нет аномальных единиц.

Провести группировку единиц наблюдения статистической совокупности по факторному признаку, образовав пять групп с равными интервалами.

Проведем сортировку данных городов по товарообороту в порядке возрастания (используя в MS Excel функцию сортировка).

Группировочный признак - товарооборот.

Результативный признак - численность населения.

Число групп задано по условию и равно 4.

Рассчитаем интервал для групп: минимальный элемент - 2, максимальный элемент - 10.

Тогда размах интервала вычисляем по формуле:


(млрд. руб.)


№ п. /п. нижняя границаверхняя граница1242463684810

Определив нижнюю и верхнюю границы, выделяем по ранжированной таблице городов, попавшие в каждую группу по товарообороту различными цветами и определяем их число.


№ города п. /п. Товарооборот, млрд. руб. Численность населения, тыс. чел. 624517245292,145283,95014501146074,056054,156024,26094,56010570225,37014670246,3801878021786207,685167,78647,88887,88737,989157,989197,989137,9589237,9589269,05100279,6105309,7105259,81051210105

Построим аналитическую таблицу:

№группы по товарооборотуколичество городовТоварооборот, млрд. руб. Численность населения, тыс. чел. всегов ср. на 1 городвсегов ср. на 1 город12 - 4410,002,50185,0046,2524 - 6835, 204,40490,0061,2536 - 81396,807,451107,0085,1548 - 10548,159,63520,00104,00Итого 190,15 2302,00 В среднем на 1 город 5,99 74,16

Вывод: Аналитическая таблица показывает взаимосвязь рассматриваемых переменных. Следовательно, с увеличением товарооборота на 1 город численность населения увеличивается. Товарооборот на 1 город по совокупности предложенных городов равен 5,99 млрд. руб., а численность населения составляет 74,16 тыс. чел.

Построить гистограмму и круговую диаграмму.

гистограмма распределения числа городов по группам товарооборота



круговая диаграмма распределения числа городов по группам товарооборота



Вывод: самое большое городов находится в интервалах от 6 до 8 млрд. руб. и составляет 13 городов, доля которых составляет 43%, а самая малочисленная группа городов имеет от 2 до 4 млрд. руб., что составляет 13% от общего числа городов.

. По данным первоначальной и аналитической таблицы по факторной и результативной переменными расчетным путем и с использованием статистических функций в Excel (в качестве проверки правильности расчета) определим: средние значения моду и медиану.

Расчетным путем.

.Мода определяется по формуле:



Наиболее часто встречаемое значение признака соответствует интервалу - [6 - 8] и этот интервал является модальным.



Вывод: Для рассматриваемой совокупности городов наиболее распространенный объем товарооборота характеризуется средней величиной 11 млрд. руб.

Медиана определяется по формуле:



Определим накопленную частоту:

группы городов по товарооборотучисло городовнакопленная частота2 - 4444 - 68126 - 813258 - 105 30

Медианный интервал - [6 - 8]



Вывод: У одной половины городов товарооборот до 9 млрд. руб., а у другой половины - свыше 9 млрд. руб.

Вывод: Средняя величина Моды больше Медианы, соответственно можно сделать вывод, что распределение городов на группы по товарообороту не соответствует нормальному закону распределения, то в распределении существует левосторонняя асимметрия.

С использованием статистических функций в Excel МОДА (), МЕДИАНА ():


=МОДА (B2: B31)

=МЕДИАНА (B2: B31)


по факторной переменной (товарооборот) мода =7,9, медиана =7, по результативной переменной (численность населения) мода = 60, медиана =82,5.

Теперь рассчитаем показатели вариации. Рассчитываем при помощи Excel среднее для Х и Y:


=СРЗНАЧ (B2: B31)

Хср =6,338, Уср =76,733


Найдем среднее линейное отклонение по формуле:


=СРОТКЛ (B2: B31)


Вывод: Средний товарооборот городов равен 6,338 млрд. руб. и отличается в среднем от фактического товарооборота для каждого города на 2,082 млрд. руб. Средняя численность населения 76,733 тыс. чел. и отличается от фактической численности населения в каждом городе на 16,836 тыс. чел. Рассчитаем столбец (Хi-Хср) ^2 при помощи Excel и найдем дисперсию для Х по формуле:


=169,238/30 = 5,641


Воспользуемся встроенной статистической функцией для расчета дисперсии фактора Х и результата У: =ДИСПР (B2: B31)

Дисперсия (Х) = 5,641, Дисперсия (У) =365,662

По дисперсии вывода нет, она экономической интерпретации не подлежит.

Найдем среднее квадратическое отклонение по формуле:

Тогда и для упрощения нахождения корня воспользуемся встроенной математической функцией КОРЕНЬ ().



Вывод: Имеет тот же экономический смысл, что и найденное среднее линейное отклонение. Средний товарооборот городов равен 6,338 млрд. руб. и отличается в среднем от фактического товарооборота на каждый город на 2,375 млрд. руб. Средняя численность населения равна 76,733 тыс. чел. и отличается от фактической численности населения на каждый город на 19,122 тыс. чел.

Рассчитаем коэффициент вариации по формуле:



Коэффициент вариации для Х = 37,473%, для У = 24,92%.

Вывод: Отобранная совокупность городов по товарообороту является качественно однородной и средний показатель является надежной величиной (37,473%). Отобранная совокупность городов по численности населения является качественно однородной и средний показатель является надежной величиной (24,92%). Таким образом, сопоставляя среднее линейное отклонение со средним квадратическим, можно сделать вывод об устойчивости.

Если (индикатор устойчивости данных) > 0,8, то значения признака неустойчивы, в них имеются аномальные выбросы.

Коэффициент устойчивости по х=0,88, это значит, что сформированные данные являются не устойчивыми, т.е. в них имеются аномальные единицы. Коэффициент устойчивости по у=0,877, это значит, что сформированные данные являются не устойчивыми, т.е. в них имеются аномальные единицы.


Аномальные единицы:

№ города п/пТоварооборот, мл рд руб. Численность населения, тыс. чел. 624517245

Задание 2


. Установить наличие и направление связи между факторной и результативной переменными

. Дать количественную оценку тесноте связи между исследуемыми переменными на основе расчета линейного коэффициента корреляции как расчетным путем (в форме расчетной таблицы) так и в автоматическом режиме с использованием статистической функций в Excel в качестве проверки правильности расчета. Сделать вывод.

. Построить уравнение регрессии и показать его на графике. Обосновать параметры уравнения. Определить теоретические значения результативной переменной. Рассчитать коэффициент эластичности. Все расчеты представить в виде расчетной таблицы. Проверить полученные расчеты в автоматическом режиме с использованием статистических функций в Excel. Сделать выводы.

. Провести дисперсионный анализ на основе расчета общей, факторной и остаточной дисперсий (расчеты показать в виде данных расчетной таблицы). На основе правила сложения дисперсий определить эмпирический коэффициент детерминации и эмпирическое корреляционное отношение. Оценить выведенное уравнение регрессии на статистическую значимость. Сделать соответствующие выводы.


Выполнение задания 2


. Установить наличие и направление связи между факторной и результативной переменными

В задании 1 выполнена группировка исходных данных и на основе группировки построена аналитическая таблица


№группы по товарооборотуколичество городовТоварооборот, млрд. руб. Численность населения, тыс. чел. всегов ср. на 1 городвсегов ср. на 1 город12 - 4410,002,50185,0046,2524 - 6835, 204,40490,0061,2536 - 81396,807,451107,0085,1548 - 10548,159,63520,00104,00Итого 190,15 2302,00 В среднем на 1 город 5,99 74,16

Вывод: Аналитическая таблица показывает взаимосвязь рассматриваемых переменных.

Следовательно, с увеличением товарооборота в среднем на 1 город численность населения в среднем на 1 город увеличивается, что позволяет сделать вывод о наличии связи между факторной (товарооборот) и результативной (численность населения) переменными.

При этом направление связи - прямое.

. Дать количественную оценку тесноте связи между исследуемыми переменными на основе расчета линейного коэффициента корреляции:

расчетным путем (в форме расчетной таблицы) по формуле



№ п/пXYX*Y (Xі-Xср) ^2 (Yі-Yср) ^214,00050,000200,0005,468714,67124, 20060,000252,0004,572280,00437,90089,000703,1002,439150,47147,80088,000686,4002,136126,93854,15060,000249,0004,789280,00462,00045,00090,00018,8211007,00474,05060,000243,0005,236280,00487,80087,000678,6002,136105,40494,50060,000270,0003,379280,004105,00070,000350,0001,79145,338114,00060,000240,0005,468280,0041210,000105,0001050,00013,408799,004137,95089,000707,5502,597150,471146,00070,000420,0000,11445,338157,90089,000703,1002,439150,471167,70086,000662, 2001,85485,871172,00045,00090,00018,8211007,004187,00080,000560,0000,43810,671197,90089,000703,1002,439150,471207,60085,000646,0001,59268,338217,00086,000602,0000,43885,871225,30070,000371,0001,07845,338237,95089,000707,5502,597150,471246,30080,000504,0000,00110,671259,800105,0001029,00011,983799,004269,050100,000905,0007,353541,338279,600105,0001008,00010,638799,004283,90050,000195,0005,945714,671292,10045,00094,50017,9631007,004309,700105,0001018,50011,301799,004итого190,1502302,00015938,600169,23810969,867сред. знач6,33876,733531,2875,641365,662

Тогда линейный коэффициент корреляции составит:


,

| | > 0,75


и приближается к 1, значит связь сильная, и наличие знака плюс говорит о прямой направленности зависимости

в автоматическом режиме с использованием статистической функций в Excel в качестве проверки правильности расчета


r=КОРРЕЛ (B87: B116; C87: C116) =0,989


В результате расчетов получили, что линейный коэффициент корреляции r = 0,989.

Связь между факторной (товарооборот) и результативной численность населения) переменными сильная, и характер зависимости - прямой.

. Построим уравнение регрессии в виде линейное уравнение регрессии:


Расчеты представим в виде расчетной таблицы:

№ п/пXYX*YX^214,00050,000200,0001624, 20060,000252,00017,6437,90089,000703,10062,4147,80088,000686,40060,8454,15060,000249,00017,222562,00045,00090,000474,05060,000243,00016,402587,80087,000678,60060,8494,50060,000270,00020,25105,00070,000350,00025114,00060,000240,000161210,000105,0001050,000100137,95089,000707,55063, 2025146,00070,000420,00036157,90089,000703,10062,41167,70086,000662, 20059,29172,00045,00090,0004187,00080,000560,00049197,90089,000703,10062,41207,60085,000646,00057,76217,00086,000602,00049225,30070,000371,00028,09237,95089,000707,55063, 2025246,30080,000504,00039,69259,800105,0001029,00096,04269,050100,000905,00081,9025279,600105,0001008,00092,16283,90050,000195,00015,21292,10045,00094,5004,41309,700105,0001018,50094,09итого190,1502302,00015938,6001374,4725

Воспользуемся методом наименьших квадратов и получим значения коэффициентов линейного уравнения регрессии на основе системы линейных уравнений:



Заносим данные из строки Итого расчетной таблицы и получаем систему вида:



Решив систему получим: а0 = 26,255, а1 = 7,964

Тогда линейное уравнение регрессии имеет вид:

Таким образом, при увеличении значения товарооборота на 1 млрд. руб. значение результативной переменной численность населения увеличивается на 7,964 тыс. чел., т.е. при увеличении товарооборота численность населения растет.

Параметр а0=26,257 не имеет экономического смысла

Определим теоретические значения результативной переменной.

Для этого в полученное уравнение линейной регрессии подставим вместо переменной х значения товарооборота из исходной таблицы данных.


товарооборот, X млрд. руб. численность населения, тыс. чел. фактическаячисленность населения, тыс. чел. теоретическое4,00050,00058,1134, 20060,00059,7067,90089,00089,1737,80088,00088,3764,15060,00059,3082,00045,00042,1854,05060,00058,5117,80087,00088,3764,50060,00062,0955,00070,00066,0774,00060,00058,11310,000105,000105,8977,95089,00089,5716,00070,00074,0417,90089,00089,1737,70086,00087,5802,00045,00042,1857,00080,00082,0057,90089,00089,1737,60085,00086,7837,00086,00082,0055,30070,00068,4667,95089,00089,5716,30080,00076,4309,800105,000104,3049,050100,00098,3319,600105,000102,7113,90050,00057,3172,10045,00042,9819,700105,000103,508

Покажем на графике линейное уравнение регрессии



Рассчитаем коэффициент эластичности по формуле:


,


т.е. на 0,342% в среднем по совокупности изменится результат у от своей средней величины при изменении фактора х на 1% от своего среднего значения.

Проверим полученные расчеты в автоматическом режиме с использованием статистических функций в Excel:

для расчета параметра а0 используем статистическую функцию


=ОТРЕЗОК (C87: C116; B87: B116) =26,257


для расчета параметра а1 используем статистическую функцию


=НАКЛОН (C87: C116; B87: B116) =7,964


Выводы: Связь между факторной (товарооборот) и результативной (численность населения) переменными сильная и прямая зависимость. Уравнение линейной регрессии наиболее точно подходит для описания характеристики изучаемого явления и уравнение линейной регрессии имеет вид. При увеличении значения товарооборота на 1 млрд. руб. значение результативной переменной численности населения увеличивается на 7,964 тыс. чел., т.е. при увеличении товарооборота численность населения растет.

Расчеты на основе расчетной таблицы совпадают с полученными результатами расчетов в автоматическом режиме с использованием статистических функций в Excel, что говорит о правильности выполненных действий.

. Провести дисперсионный анализ на основе расчета общей, факторной и остаточной дисперсий (расчеты показать в виде данных расчетной таблицы).


Строим расчетную таблицу по определению трех дисперсий:

№ п/пY фактическаяY теоретическое (Уф-Уср) ^2 (Ут-Уср) ^2 (Уф-Ут) ^2150,00058,113714,671346,71765,821260,00059,706280,004289,9370,087389,00089,173150,471154,7350,030488,00088,376126,938135,5560,142560,00059,308280,004303,6560,479645,00042,1851007,0041193,5877,924760,00058,511280,004332,0462,217887,00088,376105,404135,5561,894960,00062,095280,004214,2814,3891070,00066,07745,338113,55715,3901160,00058,113280,004346,7173,56112105,000105,897799,004850,5190,8051389,00089,571150,471164,8010,3261470,00074,04145,3387,24916,3301589,00089,173150,471154,7350,0301686,00087,58085,871117,6462,4961745,00042,1851007,0041193,5877,9241880,00082,00510,67127,7904,0201989,00089,173150,471154,7350,0302085,00086,78368,338101,0043,1812186,00082,00585,87127,79015,9602270,00068,46645,33868,3452,3532389,00089,571150,471164,8010,3262480,00076,43010,6710,09212,74325105,000104,304799,004760,1530,48426100,00098,331541,338466,4682,78527105,000102,711799,004674,8605,2382850,00057,317714,671377,01053,5332945,00042,9811007,0041139, 1934,07530105,000103,508799,004716,8722,227сумма2302,0002302,06510969,86710733,997236,795среднее76,73376,735365,662357,8007,893

Добщ= ? (Уi факт - Yсред) ^2/n=365,662

Дфакт =? (Уi теор - Yсред) ^2/n=357,800

Дост = ? (Уi факт - Уi теор) ^2/n=7,893


Общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий:


Добщ. =Дфакт. +Дост.


Подставим то, что получилось: 357,800+ 7,893= 365,693. Почти равнозначно.

Проверим выведенное уравнение регрессии на статистическую значимость.


Дфакт > Дост => 357,800> 7,893


Вывод: полученное уравнение регрессии статистически значимо.

Найдем эмпирический коэффициент детерминации R² по формуле:


R²= Дфакт/ Добщ = 357,800/ 365,662= 0,978

В Excel: =E219/D219= 0,978

< 0,978 < 1


Вывод: На 97,8% изменение численности населения зависит от влияния товарооборота и на 2,2% от других факторов.

Теперь извлечем корень из эмпирического коэффициента детерминации R² и получим эмпирическое корреляционное отношение R:


R=? R² = ?0,978 = 0,989


Вывод: Связь между товарооборотом и численностью населения тесная.


R=r (коэфф. кореляции)


Между товарооборотом и численностью населения существует линейная зависимость. И между ними существует линейная закономерная связь.

Задание 3


По результатам выполнения задания 1 с вероятностью 0,954 определите:

) ошибку выборки средней численности населения города и границы, в которых она будет находиться для генеральной совокупности городов;

) ошибку выборки доли городов с численностью 90,0 тыс. человек и более и границы, в которых будет находиться генеральная доля.


Выполнение задания 3


По условию задачи вероятность р=0,954, следовательно t=2,0 (по табл. Значение коэффициента доверия в зависимости от вероятности) и выборка 10% -ная, механическая


n/N=10%=0,1, N=30/10%=300 городов - генеральная совокупность.


) ошибку выборки среднего товарооборота на один город в год и границы, в которых он будет находиться для генеральной совокупности городов

Средний товарооборот - , дисперсия -



Вывод: На основании проведенного выборочного обследования с вероятностью 0,954 можно утверждать, что средний товарооборот находиться в пределах от 5,515 млрд. руб. до 7,161 млрд. руб.

) ошибку выборки доли городов с численностью 90,0 тыс. человек и более и границы, в которых будет находиться генеральная доля.

Доля городов с численностью 90 тыс. чел. Составляет


=СЧЁТЕСЛИ (C2: C31; ">90") =5

w=5/30=0,167


Предельная ошибка для доли вычисляется по формуле и составляет:



Таким образом, от 3,8% до 29.6%, т.е. от 11 до 88 городов в генеральной совокупности имеют численность населения более 90 тыс. чел.


Задание 4


По материалам государственной статистики построить за последние пять лет ряд динамики, характеризующий изменение общей численности населения на любом территориальном уровне. Ряд динамики представить в табличной и графической (в виде линейной диаграммы) форме.

На основе построенного ряда динамики определить:

. Показатели анализа ряда динамики (абсолютный прирост, темп роста, темп прироста, абсолютное содержание 1% прироста, средний уровень ряда, средний абсолютный прирост, средние темпы роста и прироста). Все расчеты представить в виде данных расчетной таблицы. Сделать выводы по рассчитанным показателям. Определить тенденцию развития исследуемого явления.

. Построить уравнение тренда, определив теоретические значения уровня ряда динамики за каждый период, обосновать параметры уравнения тренда, определить точечный прогноз по исследуемому показателю.


Выполнение задания 4


Источник: данные Росстата. Общая численность населения.

Обновлено 27.03.2014


ГодыВсев том числеВ общей численности населения, процентовнаселение,млн. человекгородскоесельскоегородскоесельское2009142,7104,937,874262010142,9105,337,674262011142,9105,437,574262012143,0105,737,374262013143,3106,137,27426

Берем для изучения Суммарный коэффициент городского населения:

годыгородское население2009104,92010105,32011105,42012105,72013106,1

Представим данные в графической (в виде линейной диаграммы) форме:



На основе построенного ряда динамики определить:

. Показатели анализа ряда динамики (абсолютный прирост, темп роста, темп прироста, абсолютное содержание 1% прироста, средний уровень ряда, средний абсолютный прирост, средние темпы роста и прироста).

Воспользуемся формулами:


Абсолютный прирост: цепной: базисный:

Коэффициент роста: цепной: базисный:

Темп роста: цепной: базисный:

Темп прироста: цепной: базисный:

Процент прироста: цепной:


показательгоды20092010201120122013городское населенпоказатель104,9105,3105,4105,7106,1абсолютный приростцепной 0,40,10,30,4базисный 0,40,50,81,2темп ростацепной 100,381100,095100,285100,378базисный 100,381100,477100,763101,144темп приростацепной 0,3810,0950,2850,378базисный 0,3810,4770,7631,144Абсолютное знач 1% прироста 1,0491,0531,0541,057

Вывод: величины абсолютного прироста свидетельствуют, что суммарный коэффициент численности населения по сравнению с 2009г. увеличивался, сравнительная оценка показателей цепного прироста выявила тенденцию увеличения суммарного коэффициента численности населения в 2013 г. Цепные темпы роста показывают увеличение суммарного коэффициента населения до 2013г. В 2013 г. по сравнению с 2012г. произошло увеличение всего на 0,378%. Получаем, что с 2009г. по 2013г. наблюдалось увеличение суммарного коэффициента численности населения.

Воспользуемся формулами:


Средний уровень ряда:

Средний абсолютный прирост:

Средний темп роста:

Средний темп прироста


Средний уровень ряда105,480Средний абсолютный прирост0,300Средний темп роста100,285Средний темп прироста0,285

Вывод: суммарный коэффициент численности населения ежегодно увеличивался на 0,285%.

. Построить уравнение тренда, определив теоретические значения уровня ряда динамики за каждый период, обосновать параметры уравнения тренда, определить точечный прогноз по исследуемому показателю.

Уравнение имеет вид:


Строим вспомогательную таблицу:

годыГородское населениеtt^2y*t2009104,911104,92010105,324210,62011105,439316,22012105,7416422,82013106,1525530,5Итого527,415551585

Для определения параметров надо решить систему уравнений:


n*+*?t=?y; *?t+*=?yt.


Подставляем известные значения:


+15=527,4,15+55=1585


и в результате решения получаем: =0,28, =104,64

Подставим значение параметров и получим уравнение тренда:


= 0,28*t+104,64


Подставим в полученное уравнение тренда значения t, рассчитаем теоретическое значение .


годыY расч2009104,922010105,22011105,482012105,762013106,04Итого527,4

В Excel получили точно такое же уравнение тренда, что и расчетным путем:



Прогнозное значение суммарного коэффициента численности населения на 2014 г.:


= 0,28*6+104,64 = 106,32


Вывод: с 2009 г. по 2013 г. наблюдалось увеличение суммарного коэффициента численности населения. В среднем ежегодный прирост составляет 0,285%.

При сохранении данной тенденции суммарного коэффициента численности населения в 2014 г. составит 106,32.

статистический показатель вариация выборка

Список литературы


1.Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. - М.: ИНФРА-М, 2004.

2.Практикум по статистике: Учебное пособие / под. ред. В.М. Симчеры. - Финстатинформ, 1999

.Статистика: Учебник /под. ред. С.А. Орехова. - ЭКСМО, 2010

4.<http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/population/demography/> доступ свободный, сайт Росстата


Задания Имеются следующие выборочные данные по городам одного из регионов страны в отчетном периоде (выборка 10% -ная, механическая): № города п.

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ