Определение количественной взаимосвязи между тарифным разрядом и заработной платой
Московский Государственный Технический Университет
Гражданской Авиации
Кафедра экономики ГА
Курсовая работа
по дисциплине «Статистика»
Москва - 2012
Задание
Исходные данные
Задача 1. Построить комбинационное распределение рабочих каждого цеха и завода в целом по общему стажу работы и заработной плате
Задача 2. Рассчитать средние тарифный разряд, заработную плату и производственный стаж рабочих цеха № 2, а также моду и медиану заработной платы этих рабочих
Задача 3. Рассчитать дисперсию тарифного разряда рабочих в цехах № 1 и № 2. Определить коэффициенты вариации тарифного разряда рабочих по цехам. Сделать выводы
Задача 4. С вероятностью 0,954 определить ошибку выборки для среднего тарифного разряда рабочих завода и для доли рабочих, имеющих четвертый разряд. Указать пределы возможных значений этих показателей в генеральной совокупности
Задача 5. Определить количественную взаимосвязь между признаками
.1 С помощью графического метода определить форму связи между тарифным разрядом и заработной платой рабочих цеха № 2 с № 41 по № 60 включительно (п=20)
.2 Вычислить параметры уравнения регрессии, характеризующего зависимость между тарифным разрядом и заработной платой рабочих. Построить на графике теоретическую и эмпирическую линии регрессии. Объяснить смысл полученных параметров уравнения
.3 Определить степень тесноты между рассматриваемыми признаками
Исходные данные
В результате выборочного обследования 10% рабочих авиаремонтного завода (по состоянию на 01 января текущего года) получены следующие данные:
№№ п/пРазрядПроизводственный стаж, полных летЗаработная плата, у.е.1234Цех №1145539211487347554422507511490625519738536851057492048110375331122515122352413555531411479153450916385521723526182149519104922046562212551622104832348531244125482524521263752927365202821475293852530104723143553322451833104853423508353850736517578372150538623600393452840311538Цех № 213553622150133351744155715214926419562710480835541937535102150211335281241256513425251456536155857416335231762957118234981941353720385302111494222046823435132439547256959426512588271250428365232910460304145363124517323553533304923441555335585733621486374254338345223937534404105584124506422451243311552444552745475474651559547345144838555493952450245055141155952114915339534544105525532526565215975738521582048359513575602250831847
Задача 1. Построить комбинационное распределение рабочих каждого цеха и завода в целом по общему стажу работы и заработной плате
Группировку рабочих по стажу работы и заработной плате можно показать с помощью комбинационного распределения, т.е. группировку будем проводить по нескольким признакам, по стажу (факториальный признак) и зарплате (результативный признак), при этом распределение по зарплате будем осуществлять с равными интервалами, а по стажу с неравными:
Цех №1
Таблица 1.1.
Группировка рабочих по зарплате, у.е.460-480481-500501-520521-540541-560561-580581-600ИтогоГруппировка по стажу работыМенее 2-х лет371112-3 года32164-5 лет43186-7 лет121158-9 лет131510 и более11215итого37101153140
Цех №2
Таблица 1.2.
Группировка рабочих по зарплате, у.е.460-480481-500501-520521-540541-560561-580581-600ИтогоГруппировка по стажу работыМенее 2 лет362112-3 года1441104-5 лет541106-7 лет4158-9 лет4221910 и более255315итого371118107460
Всего по заводу
Таблица 1.3.
Группировка рабочих по зарплате, у.е.460-480481-500501-520521-540541-560561-580581-600ИтогоГруппировка по стажу работыМенее 2 лет6133222-3 года1762164-5 лет972186-7 лет1621108-9 лет173211410 и более367420итого614212915105100тарифный разряд зарплата комбинационный
Задача 2. Рассчитать средние тарифный разряд, заработную плату и производственный стаж рабочих цеха № 2, а также моду и медиану заработной платы этих рабочих
Средний тарифный разряду вычисляется, как средняя арифметическая взвешенная по формуле
,
где ? - частота повторения признака, в данном случае разряда, т.е. количество рабочих
Таблица 2
Разряд (x)Число рабочих (f)152123204145762Итого60
(5*1+2*12+3*20+4*14+5*7+6*2)/60=3.2
Средний тарифный разряд для рабочих цеха №2 - 3.2
Среднюю зарплату рабочих цеха №2 можно рассчитать, как среднюю арифметическую, тогда она составляет: 31847/60 = 530,78 у.е.
Так же среднюю зарплату можно рассчитать как среднюю взвешенную на основе составленного распределения, для чего найдем середину интервалов по зарплате:
Таблица 3
Группировка рабочих по зарплате, у.е.460-480481-500501-520521-540541-560561-580581-600Середина интервала470490510530550570590Кол-во рабочих3711181074
(470*3+490*7+510*11+530*18+550*10+570*7+590*4)/60= 31840/60=530,67
Средний производственный стаж рассчитывается как средняя арифметическая взвешенная: = 6,73 года
Мода (Мо) - это значение варьирующего признака наиболее часто встречающееся в данном ряду.
Модой в дискретном ряду является варианта, имеющая наибольшую частоту.
Мода заработной платы рабочих цеха №2 определяется с учетом следующих рассуждений: наибольшую частоту в вариационном ряду распределения имеет интервал [521;540], для которого частота fMAX=18, следовательно, этот интервал является модальным.
Тогда xM0=521 у.е.; fM0=18; fM0-1=11 ; fM0+1=10; i=20 у.е.
Соответственно, мода равна:
Мо=521+20*(((18-11)/((18-11)+(18-10)))= 529,24 у.е.
Медиана (Ме) - это варианта, которая находится в середине упорядоченного вариационного ряда, т.е. она делит ряд на две равные части.
Если ряд распределения дискретный и состоит из четного числа членов, то медиана будет определяться как средняя арифметическая из двух вариант, расположенных в середине ряда.
Определим медиану заработной платы рабочих цеха №2:
В интервальном ряду распределения с равными интервалами медиана определяется по формуле:
,
где - нижняя граница медианного интервала;
- частота медианного интервала;
- сумма накопленных частот, предшествующая медианному интервалу.
Распределим заработную плату рабочих на равные интервалы, определим число рабочих получающих заработную плату в этих интервалах и рассчитаем накопленные частоты:
Заработная плата, у.е.Число рабочих fiНакопленные частоты S460-48033481-500710501-5201121521-5401839541-5601049561-580756581-600460Итого:60:-
Определяем порядковый номер медианы:
.
По накопленным частотам видно, что 30 находится в интервале (521-540), ее значение определяем по формуле:
Ме=521+20*((30-21)/18)=531(у.е.)
Т.е. делаем вывод по медиане, что половина рабочих получает заработную плату ниже 531 у.е., а половина - выше.
Задача 3. Рассчитать дисперсию тарифного разряда рабочих в цехах №1 и № 2. Определить коэффициенты вариации тарифного разряда рабочих по цехам. Сделать выводы
Дисперсия представляет собой среднюю арифметическую из квадратов отклонений вариант от их средней арифметической
?2 = ? (xi - x0)2 * f / ?f
Сгруппируем рабочих по разрядам, построив дискретный ряд распределения:
Цех №1:
Таблица 3.1
Разряд (x)Число рабочих (f)17213310465361Итого40
Средний разряд по цеху №1 находим по средней взвешенной:
(1*7+2*13+3*10+4*6+5*3+6*1)/40= 2,7
Группировку рабочих Цеха №2 проводили в таблице 2
Определим коэффициенты вариации рабочих по цехам:
V = ? / x * 100%
где:? - среднее квадратическое отклонение;
x - средний разряд.
? = ? ?2
?ц1 = ? 1,61 = 1,27;
?ц2 = ? 1,49 = 1,22;
Для цеха №1: (1,27/2,7)*100%= 47,04%
Для цеха №2: (1,22/3,2)*100%= 38%
Коэффициент вариации является критерием надежности средней. Различие указывает на большую колеблемость в величине тарифных разрядов у рабочих 1-го цеха. Тарифный разряд рабочих второго цеха имеет более низкий коэффициент, а следовательно более высокую степень однородности тарифного разряда рабочих цеха.
Задача 4. С вероятностью 0,954 определить ошибку выборки для среднего тарифного разряда рабочих завода и для доли рабочих, имеющих четвертый разряд. Указать пределы возможных значений этих показателей в генеральной совокупности
Выборочным называется такое наблюдение, при котором характеристика всей совокупности единиц дается по некоторой ее части, отобранной в случайном порядке. Выборочное наблюдение - наиболее распространенный вид несплошного наблюдения. Оно дает возможность, не прибегая к сплошному наблюдению, получить обобщающие показатели, которые правильно отражают характеристики всей совокупности в целом.
Вся совокупность единиц называется генеральной совокупностью, а та часть совокупности единиц, которая подвергается выборочному обследованию, называется выборочной совокупностью. Задача выборочного наблюдения - получить правильное представление о показателях генеральной совокупности на основе изучения выборочной совокупности.
Основными вопросами теории выборочного наблюдения являются:
определение предельной ошибки выборки для различных типов выборочных характеристик с учетом особенностей отбора;
определение объема выборки, обеспечивающего необходимую репрезентативность выборочной совокупности с учетом особенностей отбора.
Величина предельной ошибки выборки зависит от вариации признака внутри совокупности объема выборки. И способа отбора единиц.
Определим ошибку выборки для среднего тарифного разряда рабочих завода:
Средний тарифный разряд рабочих завода является:
Дисперсия по заводу:
.
Предельная ошибка выборки определяется по формуле:
,
Где: - средняя ошибка выборки;
t - коэффициент доверия, зависящий от вероятности (), с которой можно утверждать, что предельная ошибка не превысит t - кратное значение средней ошибки.
При = 0,954 t = 2,0
= 10% = 0,1 (исх. данные)
Т.е. объем выборочной совокупности (n) 100 человек, а объем генеральной совокупности (N) 1000 человек. Исходя из условий задания, отбор бесповторный.
- средняя ошибка для среднего тарифного разряда
Тогда предельная ошибка для среднего тарифного разряда равна:
= 3
-
Ошибка выборки по среднему тарифному разряду равна 0,48.
Тогда средний тарифный разряд рабочих завода колеблется от 2,52 до 3,48.
Определим ошибку выборки для доли рабочих имеющих 4 разряд.
Рассчитаем ошибку выборки по альтернативному признаку:
Определим среднее значение альтернативного показателя: из 100 человек 20 имеют 4 разряд.
Определим среднюю ошибку для доли рабочих , имеющих 4 разряд.
Ошибка выборки для рабочих завода имеющих 4 разряд составляет 0,076.
Доля рабочих, имеющих 4 разряд, колеблется от 0,124 до 0,276.
Задача 5. Определить количественную взаимосвязь между признаками
.1 С помощью графического метода определить форму связи между тарифным разрядом и заработной платой рабочих цеха № 2 с № 41 по № 60 включительно (n=20)
Сущность графического метода заключается в построении поля корреляции, которое представляет собой точечный график, для построения которого в прямоугольной системе координат по оси абсцисс откладывают значения факториального признака, а по оси ординат - результативного. По тому как располагаются точки, судят о наличии и форме связи.
В данном случае тарифный разряд будет факториальным признаком, а заработная плата - результативным, т.к. она зависит от тарифного разряда.
Осуществим группировку по разряду и заработной плате, т.к. при одинаковом разряде у разных рабочих разная заработная плата.
Таблица 5.1 Данные для построения графика
( х )Зарплата рабочих( у )14914912483, 505, 506, 508, 512502,83514, 521, 524, 526, 534, 552, 555.532,34527, 547, 552, 559546,255575, 595, 597589600
По полученным значениям разряда и заработной платы построим график, где множество получившихся точек называется - полем корреляции, а их последовательное соединение - эмпирической линией регрессии.
По графику можно определить, что связь стохастическая, т.к. каждому значению факториального признака (х), соответствует некоторое множество значений результативного признака (у).
Корреляционная связь между признаками проявляется в том, что при изменении признака (х) на единицу изменяется средняя величина признака (у). В данном случае связь линейная прямая, т.к. с возрастанием признака (х) увеличивается признак (у).
.2 Вычислить параметры уравнения регрессии, характеризующего зависимость между тарифным разрядом и заработной платой рабочих. Построить на графике теоретическую и эмпирическую линии регрессии. Объяснить смысл полученных параметров уравнения
При линейной регрессии уравнение имеет вид:
ух = а + b * x
где: ух - среднее значение результативного признака;
х - среднее значение факториального признака;
a, b - параметры уравнения связи.
Параметр a - показывает уровень заработной платы на который влияют другие факторы, которые в данном случае не рассматриваются.
Параметр b (коэффициент регрессии) - показывает на сколько в среднем изменяется результативный признак (у) при увеличении факториального признака (х) на единицу.
Таблица 5.2
№ п\пРазряд (х)Зарплата (у), у.е.х * ух2у2412506101242560364225121024426214443355216569304704444527210816277729454547218816299209465595297525354025473514154292641964835551665930802549352415729274576502505101042550255145592236163124815214914911241081533534160292851565445522208163047045535261578927667656559729852535640957352115639271441582483966423328959557528752533062560250810164258064Итого: 206310683342722235725595
Для определения параметров уравнения прямой на основе методов наименьших квадратов решается следующая система нормальных уравнений:
? у = а * n + b * ?x,
? х * у = а * ? х + b * ? x2;
10683 = 20 * a + 63 * b,
= 63 * a + 223 * b;
а = (10683 - 63 * b) / 20,
= 63 * ((10683 - 63 * b) / 20) + 223 * b;
а = 454,53,= 25,28.
ух = 454,53 + 25,28 * х
Параметр а представляет собой теоретическое значение результативного признака при х = 0 , и показывает влияние других факторов на результативный.
Параметр b - коэффициент регрессии - показывает, на сколько в среднем изменяется значение признака у при увеличении значения признака х на единицу. В данном примере при повышении тарифного разряда на 1 единицу зарплата в среднем повышается на 25,28 у.е.
у1 = 454,53 + 25,28 * 1 = 479,81
у2= 454,53 + 25,28 * 2 = 505,09
у3= 454,53 + 25,28 * 3 = 530,37
у4= 454,53 + 25,28 * 4 = 555,65
у5= 454,53 + 25,28 * 5 = 580,93
По полученным величинам составляем теоретическую линию регрессии, характеризующую форму корреляционной связи между изучаемыми признаками.
.3 Определить степень тесноты между рассматриваемыми признаками
При наличии линейной зависимости степень тесноты связи можно рассчитать с помощью коэффициента парной корреляции ( ? ).
Коэффициент корреляции определяется следующим образом:
0,90
Коэффициент корреляции изменяется в пределах от -1 до +1. Знак при коэффициенте корреляции показывает направление вязи ( прямая или обратная), а его величина - степень связи (чем ближе к 1, тем связь теснее).
Следовательно, наличие линейной связи установлено правильно и эта связь довольно тесная, т.к. ? = 0,90.
Оценка существенности коэффициента корреляции определяется на основании критерия надежности t, который рассчитывается по формуле:
20,65
В математической статистике доказано, что если t < 2,56, то связь между признаками признается несущественной. В этом случае считается, что факториальный признак не оказывает существенного влияния на результативный признак. Если t > 2,56, то связь признается существенной, т.е. факториальный признак оказывает существенное влияние на признак результативный.
Т.к. t=20,65> 2,56, то связь между признаками считается существенной. Т.е. квалификация рабочего оказывает большое влияние на заработную плату.
Список используемой литературы
1. Степанова Н.И., «Статистика» пособие по выполнению курсовой работы, М.-2011г.
. Степанова Н.И., «Статистика. Конспект лекций. Часть 1», М.-2006г.
Больше работ по теме:
Предмет: Эктеория
Тип работы: Курсовая работа (т)
Новости образования
КОНТАКТНЫЙ EMAIL: [email protected]
Скачать реферат © 2017 | Пользовательское соглашение
ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ