Статистичне дослідження

 

Вступ


Статистика - це наука, яка вивчає кількісну сторону масових суспільних, соціально-економічних та інших явищ в нерозривному зв'язку з їх якісною стороною в певних умовах місця і часу.

Отже, предмет статистики - кількісна сторона масових суспільних, соціально-економічних та інших явищ в нерозривному зв'язку з їх якісною стороною в певних умовах місця і часу.

Об'єктом статистики є людське суспільство, явища і процеси суспільного життя.

Особливості статистики:

) статистика говорить мовою цифр, але ці цифри якісно визначені;

) масовість явищ (статистика не вивчає поодинокі явища, оскільки в них не проявляються закономірності, які досліджуються статистикою); використовується математичний закон великих чисел, основним принципом якого є те, що закономірність масових явищ може проявлятися при достатньо великому числі випадків;

) статистика вивчає структуру явища і його динаміку;

) статистика вивчає явища в їх взаємозв'язку.

Закономірності проявляються в таких своїх різновидах:

) закономірності розвитку (динаміка явищ);

) закономірності структурних зрушень;

) закономірності розподілу елементів сукупності (розподіл населення за віком, за статтю);

) закономірності співзалежності (зв'язку між явищами).

Статистична сукупність - це маса однорідних в певному відношенні елементів, мають єдину якісну основу, але різняться між собою певними ознаками і підлягають певному закону розподілу.

Статистична сукупність - це певна множина елементів, поєднана умовами існування і розвитку.

Сукупність може бути однорідною і різнорідною.

Однорідна сукупність - якщо одна чи декілька ознак, що вивчаються, є загальними для всіх одиниць. Різнорідна сукупність об'єднує явища різного типу.

Сукупність складають окремі елементи, які називаються одиницями сукупності.

Одиниця сукупності - це первинний елемент статистичної сукупності, який є носієм ознак, що підлягають реєстрації і є основою обліку. Ознака - властивість окремої одиниці сукупності. Ознаки можуть бути (за характером виявлення) якісними і кількісними.

Якісні ознаки (атрибутивні ознаки) виражаються в вигляді понять, визначень, які характеризують їх суть, стан або якість. Наприклад, сорт продукції, професія, сімейний статус.

Кількісні ознаки виражають окремі значення якісних ознак у числовому виразі, окремі значення яких називаються варіантами.

Кількісні варіанти за характером виразу можуть бути первинними і вторинними.

Первинні варіанти - характеризують одиницю сукупності в цілому: абсолютні значення, вимірені, розраховані.

Вторинні варіанти (похідні, розрахункові) - дані, що не можливо перевірити тому що вони взяті з певних джерел.

По відношенню до об'єкту кількісні ознаки можуть бути прямими і непрямими. Прямі - характеризують об'єкт дослідження безпосередньо (вік осіб, кількість присутніх в аудиторії). Непрямі - ознаки, що не належать безпосередньо досліджуваному об'єкту (чи сукупності), а які належать іншій сукупності, що входить в дану.

За характером варіації кількісні ознаки можуть бути дискретними (перервні), безперервними; а якісні - багатоваріантними, альтернативними. Дискретні - ознаки, виражені окремими цілими числами, без проміжних значень. Безперервні - ознаки, що можуть набувати будь-яких значень у певних чисел. Багатоваріантні - перш за все характеризуються рангами (шкалою рангів) від більшого до меншого (напр. дуже низький, низький, середній, високий, дуже високий). Альтернативні - взаємовиключаючі значення: так-ні, позитивне-негативне.

По відношенню до часу ознаки можуть бути інтервальні і моментні. Інтервальні - це ознаки, які характеризують результат процесів. Моментні - характеризують об'єкт в певний момент часу.

В залежності між зв'язку між ознаками вони бувають факторними і результативними. Та ознака, яка впливає на іншу, називається факторною. Та ознака, яка підлягає впливу, називається результативною. Наприклад: від рівня кваліфікації робітника залежить його продуктивність. Тут кваліфікація робітника є факторною ознакою, а продуктивність - результативна. В свою чергу від продуктивності залежить заробітна плата. Тут продуктивність вже стала факторною ознакою, а заробітна плата - результативна.

Методологічною основою статистики є:

) теорія пізнання, яка визначає наукові підходи до вивчення явищ природи і суспільства;

) діалектична логіка, загальнонаукові прийоми синтезу і аналізу;

) системний підхід;

) основи економічної теорії;

) специфічні, властиві лише статистиці, методи (статистичне групування, зведення і групування, середні, узагальнюючі і аналітичні показники, індекси, вибірковий метод, балансовий метод, регресійно-кореляційний метод і т.д.).

Будь-яке статистичне дослідження має 4 етапи (всі вони об'єднуються єдиним - метою дослідження):

) статистичне спостереження - збір даних шляхом первинного (вимірення, опитування, підрахування) або вторинного збору;

) зведення і групування даних та результатів спостережень;

) узагальнюючі показники (можуть бути абсолютні, середні і відносні);

4)аналіз.

Функції статистики:

) пізнавальна функція - статистика вивчає кількісне співвідношення і взаємозв'язки, встановлює закономірності розвитку;

) контрольно-організаційна функція;

) керуюча функція - на основі наявних даних проводиться планування і керування.

Завданнями статистики відповідно до Закону України "Про державну статистику" є (мається на увазі державна статистика):

реалізація державної політики в галузі статистики;

збирання, розробка, узагальнення та всебічний аналіз статистичної інформації про процеси, що відбуваються в економічному і соціальному житті України та її регіонів;

розробка і впровадження статистичної методології, яка базується на результатах наукових досліджень, міжнародних стандартах та рекомендаціях;

забезпечення достовірності, об'єктивності, оперативності, стабільності та цілісності статистичної інформації;

забезпечення доступності, гласності і відкритості зведених статистичних даних в межах чинного законодавства.

статистичний варіація кореляційний ряд


1. Статистичний метод групування


У результаті статистичного спостереження отримують матеріал, який характеризує окремі елементи сукупності. Постає потреба у спеціальній обробці статистичних даних - зведенні матеріалів спостереження.

Статистичне зведення - це упорядкування, систематизація і наукова обробка статистичних даних. Воно включає такі основні етапи:

групування матеріалу;

розробку системи показників для характеристики типових груп і підгруп;

підбиття групових і загальних підсумків, оформлення результатів у вигляді таблиць.



Статистичне групування - утворення однорідних груп одиниць сукупності за першою суттєвою ознакою, а також тих, що мають однакові або близькі значення групової ознак, яку взято за основу утворення груп у процесі групування. За допомогою статистичного групування розвязують три основних завдання:

- поділ неоднорідної сукупності на якісно однорідні групи або виокремлення соціально-економічних типів - типологічні групування;

- вивчення складу однорідної сукупності за різними ознаками - структурні групування;

виявлення та вивчення взаємозвязку явищ та їх ознак - аналітичні групування.

Групування за однією ознакою називають простими. Якщо ж для виокремлення груп беруть по дві і більше ознак, то такі групування називають комбінованими.

Класифікація (у статистиці) - це систематизований розподіл явищ і обєктів на групи, класи, розряди на основі їх схожості або відмінностей.

В аналітичних групуваннях здебільшого застосовують кількісні ознаки. У групуваннях за кількісними ознаками постає питання про кількість груп і величину інтервалу.

Величина інтервалу - це різниця між максимальним та мінімальним значеннями ознаки в кожній групі.

Інтервали можуть бути рівними і нерівними. Рівні інтервали застосовуються тоді, коли ознака групування розподілена в сукупності більш-менш рівномірно. Величину рівних інтервалів (h) визначають за формулою


,


де Хтах> Хтіп _ значення ознаки в сукупності відповідно максимальне і мінімальне;

К-кількість груп.Кількість груп залежить від обсягу сукупності. Якщо сукупність велика, то кількість груп за рівних інтервалів можна визначити за формулою, яку запропонував американський вчений Стерджес:


,


де N - кількість одиниць сукупності.

Іноді при невеликій кількості спостережень застосовують принцип рівних частин. За такого принципу одиниці сукупності розташовуються у порядку зростання, а в кожній групі міститься однакова їх кількість. Це виключає утворення численних груп.

В окремих випадках здійснюють перегрупування даних з метою утворення нових груп на основі наявних, якщо останні не задовольняють меті аналізу.

У результаті групування отримують ряди розподілу.

Ряди розподілу - це сукупність значень групової ознаки (варіант) та відповідних частот (часток).

Варіанти - це окремі значення групувальної ознаки, а частоти - числа, які показують, скільки разів окремі значення варіант повторюються в ряді розподілу. Замість частот може бути частка, виражена коефіцієнтом або відсотком. Накопичену частоту (частку) називають кумулятивною.

Залежно від статистичної природи групувальної ознаки розрізняють атрибутивні та варіаційні ряди розподілу.

В атрибутивних рядах одиниці сукупності розподіляються за атрибутивними (якісними) ознаками, у варіаційних рядах - за кількісними ознаками.

Варіаційні ряди можуть бути дискретними або інтервальними. Характер варіаційного ряду визначається характером варіації. Варіація може бути дискретною (перервною) або неперервною.

Дискретними називають ряди розподілу, у яких варіанти є цілими числами.

Інтервальними називають ряди розподілу, в яких варіанти мають вигляд інтервалів.

У результаті статистичного спостереження ми отримали матеріал по цукровим заводам в кількості 20 підприємств. Спостереження велося за такими критеріями:

-вартість основних фондів, тис. грн.

-валова продукція, тис. грн.

-середньоспискова чисельність працівників, чол.

-в тому числі робітників, чол.

-перероблено цукросировини, тис. ц.

-вироблено цукру, тис. ц.

середньодобова переробка буряків, тис.


Таблиця 1 - Дані завдання.

№ п/пВартість осн фондів, тис. грнВалов. Прод. Тис. грнСередспискова чисел працівн. чолВ т.ч. робітників, чол..Перероб. цукросир. Тис.цВиробл. цукру, тис.цСередньодобова перероб. буряків410097724988378915281661858097525643335993812010,761111614090839724125315812748803525933821138517114,287355543152642881810112,19100667680676607135315420,81078848226684619142518821117038408112911196168819620,712485010473556492194324418,51343506097496438124813417,11434275307367311110112212,41560627400706625147016921,31661137079555491118916518,4 1797876339623556120213922,11838491544371314 2853310,7191082611430977886208225645,32О66954105738639129717216,921663313366922917110414517,72264726340495416113814220,623608336244564035528413,9

Для подальших розрахунків необхідно виконати первинне групування вихідних даних за основною ознакою - валова продукція. Так як групування проводимо по одній ознаки, то воно у нас вважається простим.


Таблиця 2 - Сортування (впорядкування) даних.

№ п/пВалов. прод. Тис. грнВартість осн. фондів, тис. грнСеред. спискова чисел працівн. чолВ т.ч. робітників, чолПерероб. цукросир. тис.цВиробл. цукру, тис.цСередньодобова перероб, буряків1815443849371314 2853310,7735254880933821138517114,223362460834564035528413,9114081703812911196168819620,72О41056695738639129717216,955256809743335993812010,71453073427367311110112212,485431735552642881810112,11360974350496438124813417,11763399787623556120213922,12263406472495416113814220,61670796113555491118916518,4 47249100978837891528166181574006062706625147016921,39768010066676607135315420,8108226788468461914251882112104734850556492194324418,5191143010826977886208225645,321133666633922917110414517,761409011116839724125315812

Визначаємо кількість груп за формулою Стерджес:


- кількість підприємств дорівнює 20.

Отже, кількість груп 6.

Визначаємо крок інтервалу:



Межі груп мають такі інтервали


154436353635572657267817781799089908119991199914090

Після визначення інтервалів групування, побудуємо таблицю допоміжного групування.


Таблиця 3 - Допоміжна таблиця групування

№ п/пВалов. прод. Тис. грнВартість осн. фондів, тис. грн..Серед. спискова Чисел. працівн. чолВ т.ч. робітників, чолПерероб. цукросир. Тис.цВиробл. цукру, тис.цСередньодобова перероб, буряків1815443849371314 2853310,7735254880933821138517114,223362460834564035528413,9?86931481217601538222228838,8114081703812911196168819620,72О41056695738639129717216,955256809743335993812010,71453073427367311110112212,485431735552642881810112,1?241803261220641737415451552,11360974350496438124813417,11763399787623556120213922,12263406472495416113814220,61670796113555491118916518,4 47249100978837891528166181574006062706625147016921,39768010066676607135315420,8?48184529474434392291281069138,31082267884684619142518821?8226788468461914251882112104734850556492194324418,5191143010826977886208225645,3?219031567615331378402550063,821133666633922917110414517,761409011116839724125315812?274561774917611641235730329,7

Для зручності зробимо підсумкову таблицю первинного групування.

Таблиця 4 - Підсумкова таблиця первинного групування

Номер групиМежа інтервалуаСередина інтервалаВалов. прод. тис. грнВартість осн фондів, тис. грнСередспискова чисел працівн. чолВ тч робітників, чолПерероб. цукросир. тис.цВиробл. цукру, тис.цСередньодобова Перероб. буряків11544-36352589,586931481217601538222228838,823635-57264680,5241803261220641737415451552,135726-78176771,548184529474434392291281069138,347817-99088862,58226788468461914251882159908-1199910953,5219031567615331378402550063,8611999-1409013044,5274561714917611641235730329,71386421410801223610835233112863343,7

Таблиця 5 - Ряд розподілу

Номер групиМежа інтервалаСередина інтервалаЧастота Частка Накопичена часткаВідносна щільність11544-36352589,530,1530,00007223635-57264680,5502580,0001235726-78176771,570,35150,0001747817-99088862,510,05160,00002459908-1199910953,520,1180,000048611999-1409013044,520,1200,000048

У даній таблиці варіанта - середина кожного інтервального ряду, беремо з попередніх розрахунків. Частота показує кількість підприємств, що входять в кожен інтервал. Частку знаходимо за формулою:


,


де f - відповідна частота групи;- загальна кількість підприємств.

Накопичена частота - це сума частот:

.


відносна щільність:


,


де f - відповідна частота;- крок інтервалу.

За сформованим рядом розподілу будуємо статистичні графіки. Статистичний графік - спосіб наочного подання і викладання даних за допомогою геометричних знаків та інших графічних символів з метою їх узагальнення і аналізу.

Полігон розподілу - графічне зображення варіаційного ряду в системі координат у вигляді ламаної, що послідовно зєднує точки. По осі абсцис відкладається значення варіант, по осі ординат - частоти.

Рисунок 1 - Полігон розподілу


Гістограма - найпоширеніший вид графічного зображення інтервальних рядів. Вона будується за відносною щільністю у вигляді прямокутників так, щоб площа їх дорівнювала 1.


Рисунок 2 - Гістограма


Кумулята - графічне порівняння двох або більше варіаційних розподілів з рівними чи нерівними інтервалами. Вона будується за кумулятивним розподілом накопичених частот, при цьому використовуються праві кінці інтервалів.


Рисунок 3 - Кумулята


Огіва - це різновид кумулятивного розподілу. Вона є дзеркальним відображенням кумуляти. На осі ординат відкладаємо межі інтервалів, по осі абсцис - накопичені частоти.

Рисунок 4 - Огіва


2. Середні величини та показники варіації


Найважливішою характеристикою варіаційного ряду розподілу є середня величина, яка здатна відображати характерний рівень ознаки притаманний усім елементам сукупності.

Статистичні середні відображають активну наявність певних умов, що проявляються в кожній одиниці досліджуваної сукупності; вони дають узагальнюючу кількісну характеристику статистичним сукупностям однотипних явищ за варіаційною ознакою.

Середньою величиною в статистиці називаються кількісні показники характерного, типового рівня масових однорідних явищ, який складається під впливом загальних причин і умов розвитку. В звязку з цим середні величини належать до узагальнюючих статистичних показників, які дають зведену, підсумкову характеристику масових суспільних явищ. У середній величині гасяться (розчиняються) всі відмінності та особливості індивідуальних значень ознак, і вона є «рівнодіючою» значень цих ознак. Розрахунок середніх передбачає обовязковість урахування умов виникнення кожної індивідуальної величини, інакше обчислення можуть призвести до фіктивних середніх. Щоб середня величина відображувала типове і загальне для всієї сукупності, остання повинна бути якісно однорідною.



Середня арифметична - застосовують тоді, коли обсяг варіюючої ознаки для сукупності є сумою індивідуальних значень її окремих елементів.



Середня гармонійна - застосовують тоді, коли відсутні безпосередні дані про вагу, а відомі варіанти ознак, що усереднюються (х), і добутки значень варіантів на кількість одиниць, які мають значення . Розраховують на основі зворотних значень ознаки.


Середня геометрична - застосовується тоді, коли визначальна властивість сукупності формується як добуток індивідуальних значень ознаки (аналіз динаміки для визначення середнього темпу зростання).



де ? - символ добутку;

хі - відносні величини динаміки;

?1nj = ni - часовий інтервал.

Середня квадратична - використовують у розрахунку показників віріації.



Ми використовуємо середню арифметичну зважену:



Таблиця 6 - Розрахунок середніх величин

Номер п/пСередина інтервала (х)Частота fxf(x-)212589,537768,51748912424680,5523402,5437228136771,5747400,5048862,518862,54372281510953,522190717489124613044,522608939350529Сума2013543083073339середнє6771,54153667

Структурні середні величини

У ряді розподілу важливе значення мають структурні середні величини, які характеризують структуру аналізованих сукупностей - мода і медіана.

Мода (М0) - варіанта, що найчастіше повторюється в ряді розподілу і розраховується за формулою:



де Х0 - нижня межа модального інтервалу;- величина модального інтервалу;Mo - частота модального інтервалу;Mo-1 - частота попереднього інтервалу;Mo+1 - частота інтервалу, наступного за модальним.

Медіана (Ме) - варіанта, що ділить ранжований ряд на дві рівні частини і розраховується за формулою:



де ХМе - нижня межа медіанного інтервалу;- величина медіанного інтервалу;

- півсума частот медіанного інтервалу;

- сума частот перед медіанним інтервалом;

- частота медіанного інтервалу.

Основні показники варіації

Середні величини характеризують рівень однорідних масових явищ і процесів, але не дають ніякого уявлення про коливання ознаки, тому середні величини доповнюють показниками варіації. Вимірювання степеня коливання ознаки, її варіації - невідємна складова аналізу закономірностей розподілу.

Варіація будь-якої ознаки формується під впливом двох причин (факторів):

основна, що наявна і тісно пов`язана з природою самого явища;

другорядна - випадкова для цієї сукупності в цілому.

Середні величини характеризують типовий рівень варіюючої ознаки. Крім даних характеристик, обчислюються ще й наступні:

Розмах варіації - Являє собою різницю між максимальною і мінімальною варіацією.


.


Середнє лінійне відхилення - це сума, або зважена сума абсолютних величин відхилень варіант від середнього значення.



Основною характеристикою варіацій є дисперсія, за допомогою якої оцінюється відхилення варіаційної ознаки від середнього арифметичного.



Недоліком дисперсії є те, що вона завжди представлена у квадраті, що не придатне для аналізу. Тому дисперсія має недолік - одиницю виміру. Щоб ліквідувати цей недолік, розраховується:

Середнє квадратичне відхилення:



При порівнянні варіації різних ознак або однієї ознаки в різних сукупностях використовуються коефіцієнти варіації:


а) - лінійний;

б) - квадратичний;

в) - осциляції.


Таблиця 7 - Показники варіації

варіантичастотирозрахунки XifiXifi|Xi-||Xi-|fi(Xi-)2(Xi-)2fi2589,537768,541821254617489124524673724680,5523402,52091104554372281218614056771,5747400,500008862,518862,5209120914372281437228110953,522190741828364174891243497824813044,52260896273125463935052978701058Сума201354304600283073339192380364середнє6771,52300,141536679619018,2

Згідно розрахунків із таблиці 7 знаходимо:


= 2300,1

= 9619018,2

=


лінійний коефіцієнт варіаціїї


=(2300,1/6771,5)·100% = 33,97%


квадратичний коефіцієнт варіації


=(3101,45/6771,5)·100% = 45,8%


- коефіцієнт варіації оселяції


= (10455/6771,5)·100% = 154,4%


. Кореляційний аналіз


Кореляцією називається неповний звязок між досліджуваними явищами. Це така залежність, коли будь-якому значенню однієї змінної величини може відповідати декілька різноманітних значень іншої змінної величини. Вона відображає закон множини причин і наслідків і є вільною неповною залежністю.

Модель кореляційно-регресійного аналізу (лінійної регресії) є найбільш розповсюдженою регресійною моделлю. По-перше, вона приваблює своєю простотою, тому що немає простіше функції, ніж лінійна (рівняння прямої лінії). По-друге, при лінійній апроксимації легко вдається одержати мінімальну середньоквадратичну помилку.

У кореляційно-регресивному аналізі оцінювання лінії регресії для добавлення ряду «лінія регресії» здійснюється не в окремих точках, як в аналітичному групуванні, а в кожній точці інтервалу зміни факторної ознаки х. Тобто лінія регресії в цьому випадку безперервна і зображується у вигляді певної функції, яка називається рівнянням регресії, а У- це теоретичні значення результативної ознаки.

Парною лінійною регресією Y на X називається одностороння стохастична залежність між випадковими величинами показника Y і фактора X, які знаходяться у причиново-наслідкових відношеннях, причому зміна фактора викликає пропорціональну зміну показника.

Нехай ми маємо набір значень двох змінних xi, yi, i=1,…,n. Пари (xi,yi) можна зобразити точками на площині X-Y:

Уведемо гіпотезу, що між показником Y і фактором X існує стохастична лінійна залежність. Суть задачі полягає в тому, щоб знайти (підібрати, підігнати) лінію, яка найкраще описує залежність Y від X.


Модель лінійної регресії є, власне кажучи, лінійною апроксимацією (наближенням) реальної лінії регресії y(x). Вона описується рівнянням прямої



де множник а1 називається коефіцієнтом регресії. Пряма повинна проходити так, щоб стосовно крапок вибірки


{Xi,Yi}(n)={ (x1,y1), (x2,y2),…(xn,yn)}


забезпечити мінімальне квадратичне відхилення. Для кожної крапки вибірки помилка результативної ознаки дорівнює

Ця модель є найбільш розповсюдженою регресійною моделлю. По-перше, вона залучає своєю простотою, оскільки немає простіше функції, ніж лінійна (рівняння прямої лінії). По-друге, при лінійній апроксимації легко вдається одержати мінімальну середньоквадратичну помилку.

Модель лінійної регресії є, власне кажучи, лінійною апроксимацією (наближенням) реальної лінії регресії y(x). Вона описується рівнянням прямої, де множник а називається коефіцієнтом регресії. Пряма (6.2) повинна проходити так, щоб стосовно крапок вибірки


{Xi,Yi}(n)={ (x1,y1), (x2,y2),…(xn,yn)}


забезпечити мінімальну СКО. Для кожної крапки вибірки помилка

результативної ознаки дорівнює


Середній квадрат помилки апроксимації пропорційний сумі квадратів помилок

(a,b)=n-1Si ei2=n-1Si(a1xi0-yi)2


Визначення параметрів a і b моделі здійснюється методом найменших квадратів (МНК). Тому що мінімум функції Е при варіації a і b має місце в крапці нульових часток похідних, то одержимо систему двох лінійних відносно a і b рівнянь.



Ця система носить назву система нормальних рівнянь.

Рішення системи рівнянь має вигляд



Знаменники в цих вираженнях пропорційні дисперсії факторної ознаки



а чисельник пропорційний моменту кореляції між ознаками X і Y.

Тут використана властивість незміщеності оцінок x та y. З урахуванням співвідношень коефіцієнт регресії можна виразити як



Після визначення a1 для розрахунку a0 зручніше скористатися формулою:

Вибираючи формулу кореляційного звязку, насамперед виходять з економічної природи явищ, простоти аналітичної функції і вимог до обмеженої кількості параметрів.

Рівняння кореляційного звязку є аналітичним. За його допомогою відображається взаємозвязок ознак, а саме залежність між варіаціями результативної і факторної ознак.

Найчастіше використовують такі рівняння:


-прямої лінії ;

-гіперболи ;

-параболи другого порядку ;

-експоненти .


де у - значення результативної ознаки, що залежить тільки від факторної;

х - значення факторної ознаки;

а0, а1, а2 - сталі величини, які називаються параметрами рівняння.

Аналітичне рівняння кореляційного звязку і його параметри визначають методом найменших квадратів, використовуючи систему нормальних рівнянь. Так, для прямої лінії використовують таку систему нормальних рівнянь:



Таблиця 8 - Кореляційно-регресійний аналіз

Факторна ознака, хРезультативна ознака, ух*ух2у2Х-Хсер(Х-Хсер)2У-Усер(У-Усер)27249100977319315352548001101949409316,9100425,613013907816952568097425578322762553665561409-1676,12809311,211013102616914090111161566244401985281001235654567157,951235532,440321625702435254880172020001242562523814400-3407,111608330,4-2204485761654317355399450052949576154096025-1501,12253301,21271734417680100667730688058982400101324356747,9559354,4129828892324822678846485378467667076621574561293,91674177,2180064000040817038287220781665456149533444-2851,18128771,21-46211610473485050794050109683729235225003540,912537972,8-2234499075660974350265219503717340918922500-835,1697392,01-2734747475653073427181870892816424911744329-1625,12640950,01-36571337364974006062448588005476000036747844467,9218930,41-1022104448470796113432739275011224137368769146,921579,61-97194284163399787620397934018292195785369-593,1351767,6127037306209154438495942856238393614814801-5388,129031621,6-32351046522511430108261237411801306449001172022764497,920231104,437421400256441056695274829751685102544823025-2827,17992494,41-38915132113366663388656678178649956439966896433,941395069,2-45120340163406472410324804019560041886784-592,1350582,41-61237454436246083220447921313337637002889-3308,110943525,6-100110020011386421416801054981742116586240211058197302047821941021586106932,1708452749087,1

Для знаходження невідомих параметрів складаємо систему нормальних рівнянь використовуючи дані таблиці:

Звідси знаходимо шукані величини:

а0 = 4588,4

а1 = 0,36

Отримавши потрібні параметри, складаємо рівняння, за допомогою якого знаходимо теоретичне значення допоміжної ознаки Y:


ГРАФІК

Рисунок 5 - Відображає зв'язок між факторною і результативною ознаками

Знайдемо загальну, залишкову та факторну суми квадратів і перевіримо правильність складання таблиці.


Таблиця 9

Дані величиниРозрахункові величиниХУ(У-)2(сер)27249100977198,048403969,08213005,1216525680976480,562612878,274364139,833614090111169660,82117607,046639898,24352548805857,4955310,761504547,56543173556543,56658434,8736292075,39367680100667353,27359283,8472468,64822678847549,76111716,3776216932,3776408170386057,56961262,59361053579,0741047348508358,6812310835,341624809,102609743506783,325921046,22290408,4624530734276498,929436692,486342318,6064740060627252,41417052,1628358,56707961137136,841048248,3462792,0656633997876870,448506322,23445607,8736154438495144,241677646,6583762668,85811430108268703,24506279,842621808,64410566956066,2395389,441035916,841336666339400,167657174,4665364597,146634064726870,8159041,4445454,24362460835893,0436084,80161418385,722138642141680141679,1276252276,2826539772,36


Перевірка


Похибка

Знаходимо загальну, залишкову та регресійну дисперсію, а також перевіримо адекватність рівняння регресії:


- залишкова.

- кількість невідомих параметрів у рівнянні, дорівнює 2.


- факторна


Для перевірки адекватності рівняння регресії застосуємо критерій Фішера:

обчислюємо спостирежувальне значення критерія



за таблицею знаходимо критичне (табличне) значення



порівняння Fcn>Fkp (6,26>4,41) - немає підстав відхилити тестуючу гіпотезу, тобто вона є адекватною.

Оцінка щільності зв´язку

Оцінка щільності звязку - це характеристика ступеня залежності між ознаками. Показниками щільності звязку є коефіцієнти парної, часткової і множинної кореляції та детермінації, рангові коефіцієнти, коефіцієнти асоціації, взаємної спряженості та ін.

Вибір відповідного коефіцієнта залежить від виду випадкової величини, форми їх залежності, закону розподілу. Для оцінки суттєвості звязку використовують критерій значущості.

Найчастіше використовують лінійний коефіцієнт кореляції, який обчислюється за формулою (модифікація):

? - середнє квадратичне відхилення.


Використовуються також такі формули:


; ; .


Коефіцієнт r змінюється в межах ±1. Додатнє значення цього показника свідчить про прямий зв'язок. Що більше його значення, то щільніший зв'язок між у та х і навпаки. Отже, у нас додатнє значення коефіцієнта і тому маємо прямий зв'язок.

У літературі пропонуються різні оцінки коефіцієнта кореляції, але найчастіше застосовують такі оцінки:=0 звязок відсутній=0,1-0,3 звязок слабкий=0,3-0,5 звязок помірний=0,5-0,7 звязок суттєвий (середній)=0,7-0,9 звязок тісний (високий)=1 звязок функціональний.

Оскільки коефіцієнт лежить в межах 0,5 - 0,7, можемо зробити висновок, що зв'язок суттєвий.

Знаходимо коефіцієнт детермінації. Значення R2 показує скільки відсотків варіації результативної ознаки у залежить від варіації факторної ознаки х.



Це означає, що 25% даних підпорядковані лінійній залежності.

Індекс кореляції:



У разі лінійної залежності R=|r|

,5 = 0,5 - умова виконується.


. Ряди динаміки


Динамічний ряд - це послідовність чисел, які характеризують зміну того чи іншого соціально-економічного явища у часі. Елементами динамічного ряду є перелік хронологічних дат (моментів) або інтервалів часу і конкретні значення відповідних статистичних показників, котрі називаються рівнями ряду (у).

При вивченні динаміки важливі не лише числові значення рівнів, а і їх послідовність. Як правило, часові інтервали між рівнями однакові (доба, декада, календарний місяць, квартал, рік). Узявши будь-який інтервал за одиницю, послідовність рівнів записуємо так: у1, у2, у3,...,уn.

Залежно від статистичної природи показника-рівня розрізняють динамічні ряди первинні й похідні, ряди абсолютних, середніх і відносних величин. За ознакою часу динамічні ряди поділяються на інтервальні та моментні. Рівень моментного ряду фіксує стан явища на певний момент часу t, наприклад, кількість працюючих на початок року, студентів - на 1 вересня. В інтервальному ряді рівень - це агрегований результат процесу, що залежить від тривалості часового інтервалу.

Динамічні ряди характеризуються низкою показників.

1. Абсолютний приріст, тобто різниця двох рівнів ряду - наступного і попереднього:


базисний ;

ланцюговий ,


де y0 yi - відповідно початковий і кінцевий рівень ( yi-1 - попередній рівень ряду).

. Коефіцієнт зростання - це відношення наступного рівня до попереднього:


базисний ;

ланцюговий .


3.Темп зростання - це процентне співвідношення двох рівнів ряду:


базисний ;

ланцюговий .


Темп зростання можна розрахувати, помноживши відповідний коефіцієнт зростання на 100:


Т = К * 100.


Темп приросту - це відношення абсолютного приросту до попереднього або першого рівня, виражене у відсотках:


базисний (або Кi - 1);

ланцюговий (або Кi - 1).


5. Абсолютна величина одного процента визначається як відношення абсолютного приросту до темпу приросту або діленням базисного чи попереднього рівня на 100:

6

базисний (або yi / 100);

ланцюговий (або yi-1 / 100).


Оскільки показники ряду динаміки змінюються за роками, виникає необхідність їх узагальнення і розрахунку середніх показників.

Середній рівень інтервального ряду визначається за середньою арифметичною простою


.


У моментному ряді динаміки середній рівень визначається за середньою хронологічною


.


Середній абсолютний приріст знаходять як середню ланцюгових


абсолютних приростів


.


Середній коефіцієнт зростання розраховують за середньою геометричною


,


де Кi - ланцюгові коефіцієнти зростання, або за формулою


.


Середньорічний темп зростання:


.


Обрахування характеристики ряду динаміки

В якості досліджуваного ряду динаміки можна обрати ранжирования ряд основної ознаки.

Проведемо розрахунки показників ряду динаміки за основною ознакою - валова продукція.


Таблиця 9 - Розрахунок показників ряду динаміки

Період Ріень рядуАбсолютний прирістТемп зростанняТемп приростуАбсолютний вміст 1% приростуланцюговийбазиснийланцюговийбазиснийланцюговийбазиснийty?i=yi-yi-1?i=yi-y0Tp=(yi/yi-1)100%Tp=(yi/y0)· 100%Tnp=Tp - 100%|A%|=yi/yi-111544-------2352519811981228,3228,3128,3128,32,2833624992080102,81234,722,81134,721,03440814572537112,61264,3112,61164,311,1354105242561100,59265,870,59165,871,016525611513712128,04340,4128,04240,411,2875307513763100,97343,720,97243,721,01854311243887102,34351,752,34251,751,02960976664553112,26394,8812,26294,881,121063392424795103,97410,563,97310,561,0411634014796100,02410,620,02310,621,00021270797395535111,66458,4811,66358,481,121372491705705102,4469,492,4369,491,0241474001515856102,08479,272,08379,271,021576802806136103,78497,413,78397,41,0381682265466682107,11532,777,11432,771,07171047322478929127,32678,327,32578,301,2718114309579886109,14740,289,14640,281,0911913366193611822116,94865,6716,94765,671,17201409072412546105,42912,565,42812,561,054?138642yсер6932,1?у660,3Тр112,34Тпр12,34

Оскільки показники ряду динаміки змінюються за періодами, то виникає необхідність їх узагальнення і розрахунку середніх показників. Середній рівень ряду визначається за середньою арифметичною простою, тобто


.


Отже, маємо

Середній абсолютний приріст



Середній темп зростання



Середній приріст



Розрахувавши середні показники ряду динаміки, ми можемо зробити висновок, що середній темп зростання - 112,34%, а середній темп приросту - 12,34%. Таким чином говоримо, що даний ряд динаміки проявляє тенденцію до збільшення на 12,34%.

Вирівнювання рядів динаміки

Вирівнювання рядів динаміки проводиться для виявлення тенденції (тренду).

При розрахунку пятичленної ковзаючої середньої кожен наступний інтервал утворюється на основі попереднього із заміною одного рівня.


; і т.д.


Середній темп зростання розраховується за допомогою коефіцієнта, який знаходиться за формулою середньої геометричної


.


Розрахований коефіцієнт множимо на перший рівень ряду Y1 та отримуємо середній рівень ряду Y2, помноживши даний Y2 на коефіцієнт K, отримуємо середній рівень ряду Y3 і т.д., поки не отримаємо Yn.


Таблиця 10 - Вирівнювання ряду динаміки методом укрупнення періодів і середньої плинної

Період Рівень рядуМетод укрупнення середніхРозрахунки Середня ковзаючаСередній темп зростання115443375,83375,8-235254118,21729,28336244474,639484408148364058,88541055239,24570,7265256 568656864597,6753075902,85886,72854316257,25943,84960976620,86082,721063396881,46828,641163407149,67149,67099,681270797526,87100,81372498205,67928,481474009041,88118,8815768010235828816822611517115178601,617104739871,89213,1218114307777,211729,7619133665491,212801,62014090281814969,92

Ряд динаміки


Проведемо згладжування даного ряду за п´ятичленною середньою таблиці 10. Отримаємо вирівнювання ряду методом укрупнення періоду.



Проводимо вирівнювання також методом середньої плинної.



Для вирівнювання методом мінімальних квадратів або аналітичним методом побудуємо таблицю.


Таблиця 11 - Вирівнювання методом мінімальних квадратів

tyt2ty11544115441932,923525470502459,1336249108722985,34408116163243511,55410525205254037,76525636315364563,97530749371495090,18543164434485616,39609781548736142,5106339100633906668,7116340121697407194,9127079144849487721,1137249169942378247,31474001961036008773,51576802251152009299,71682262561316169825,9171047328917804110352,1181143032420574010878,3191336636125395411404,5201409040028180011930,721013864228701805587138636Сума-6932,1143,590279,356932,1середні

Для побудови рівняння тенденцій або рівняння тренду виду скористаємося методом кореляційно-регресійного аналізу і знайдемо коефіцієнти а0, а1 з системи:


;

.


Для знаходження невідомих параметрів складаємо систему нормальних рівнянь використовуючи дані таблиці:

а0 + 210а1 = 138642

а0 +2870а1 = 1805587

Із даної системи рівнянь знаходимо шукані параметри а0, а1:

а0 = 1406,7

а1 = 526,2

Отримавши потрібні параметри, складаємо рівняння, за допомогою якого знаходимо теоретичне значення допоміжної ознаки Y.

Отже, маємо рівняння тренду


Аналітичне вирівнювання


. Індекси ряду


Цей метод широко використовується під час статистичного аналізу роботи підприємств, галузей усього народного господарства.

Індексний метод дає можливість визначити ступінь впливу окремих факторів на загальний результат.

Індекси - це відносні величини, які характеризують явище у розвитку, динаміці, часі і просторі. Індекси поділяються на індивідуальні та загальні.

Для розрахунку індивідуальних індексів необхідно величину одного елемента складного явища за один період віднести на його величину в другому періоді, прийнятому за базу для порівняння. У статистиці позначають кількість буквою q; ціну буквою Р; собівартість буквою Z; затрати часу на виробництво продукції буквою Т [або t].

Індивідуальні індекси визначаються такими формулами:

індекс фізичного обсягу iq=q1/q0;

індекс цін iр10;

індекс собівартості iz=z1/z0;

індекс трудомісткості it=t1/t0.

Загальні індекси показують співвідношення сукупності явищ, котрі складаються з різнорідних, безпосередньо не порівнюваних елементів. Загальний індекс розраховується за формулою


.


Це агрегатна формула індексів. Чисельник та знаменник тут приводять до порівняльного вигляду за допомогою таких сумірників, як ціна, собівартість, трудомісткість одиниці продукції.

У формулі 1 обсяг продукції в натуральних показниках, а ціна - в грошовій формі змінюється як у базисному, так і в звітному періоді, тому таку формулу називають агрегатний індекс перемінного складу.

Якщо зафіксувати ціну на продукцію на базисному рівні, одержимо індекс, який показує зміну тільки обсягу виробництва в базисних цінах


.


Такий індекс називають індексом фізичного обсягу виробленої продукції в порівняльних цінах.

Якщо зафіксувати обсяг виробництва продукції на рівні звітного періоду, а ціни змінювати в кожному періоді, то отримаємо індекс, котрий показує вплив цін на загальний індекс


. ( 3 )

Ці індекси звязані між собою


. ( 4 )


Щоб визначити вплив окремих факторів на результативний показник в абсолютних величинах, коли фактори співзалежні між собою, застосовуються формули


.


Абсолютний вираз, який характеризує зміну обсягу виробництва в грошовому вигляді у звітному періоді порівняно з базисним, має вигляд


Sq1p1-Sq0p0=Spq.


Щоб визначити вплив тільки обсягу виробництва, застосовують формулу підстановок


Dq= (q1-q0) .


Вплив ціни на абсолютний обсяг виробництва знаходимо за формулою


Dp=q0(p1-p0), звідси Dpq=Dq+Dp.


Співзалежні величини досить часто зустрічаються в статистичних розрахунках. Тому при аналізі це враховується, і вплив кожного фактора визначають за допомогою індексних систем.


Список використаної літератури


1.Фінансова статистика (з основами теорії статистики): Навч. посіб./ Головач А.В., Захожай В.Б. -К.:МАУП, 2002. - 224с.

2.Опря А.Т. Статистика. Математична статистика. Теорія статистики. Навчальний посібник. - Київ: Центр навчальної літератури, 2005. - 472с.

3.Методичні рекомендації та вихідні дані до контрольної роботи з дисципліни «Статистика» для слухачів центру післядипломної освіти економічних спеціальностей усіх форм навчання. - Полтава: ПолтНТУ, 2006. -33с.


Вступ Статистика - це наука, яка вивчає кількісну сторону масових суспільних, соціально-економічних та інших явищ в нерозривному зв'язку з їх якісною сто

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ