Ошибки статистического наблюдения

 

  1. Ошибки статистического наблюдения

Собранные в процессе статистического наблюдения данные по отдельным единицам изучаемой совокупности на последующих стадиях статистического исследования должны быть сведены (обобщены) и обработаны, чтобы получить объективный и точный ответ на все вопросы, поставленные целью исследования. Качество и правильность результатов любого статистического исследования, которые можно получить на основе обобщения, обработки и анализа статистических данных, зависят от качества и достоверности исходного материала - статистических данных.

Всякое статистическое наблюдение ставит задачу получения таких данных, которые по возможности более точно отображали бы действительность, состояние изучаемых единиц совокупности. Под точностью статистической информации понимается уровень (степень) соответствия зафиксированной при статистическом наблюдении величины изучаемого признака действительному его значению.

Отклонения или разности между зафиксированными при статистическом наблюдении величинами изучаемого признака и действительными (истинными) величинами его называют ошибками наблюдения.

В зависимости от источников и причины возникновения неточностей, допускаемых в процессе статистического наблюдения, обычно выделяют ошибки регистрации и ошибки репрезентативности (представительности).

Ошибки регистрации возникают вследствие неправильного установления фактов в процессе наблюдения или неправильной их записи. Они имеют место как при сплошном, так и несплошном наблюдении. Ошибки регистрации подразделяются на случайные и систематические.

Случайные ошибки - это ошибки, допущенные при заполнении бланков (цифра записана не в ту графу или допущена описка в записи), оговорка в ответах, нечеткость в вопросе и соответственно в ответе и т.д.

Систематические ошибки могут быть преднамеренными и непреднамеренными. Преднамеренные ошибки (сознательные) получаются в результате того, что при знании действительного состояния (величины) признака сознательно сообщаются неправильные данные. Непреднамеренными называются ошибки, вызываемые случайными причинами: например, неправильностью измерительных приборов, невнимательностью регистраторов и др.

Ошибки репрезентативности (представительности) свойственны не сплошному наблюдению. Они возникают в результате того, что состав отобранной для обследования части массового явления (части единиц совокупности, выборки) недостаточно полно отображает особенности, сущность всей изучаемой совокупности.

Эти ошибки тоже могут быть случайными из-за того, что отобранные единицы совокупности неполно воспроизводят всю совокупность. Величина случайной ошибки репрезентативности может быть оценена с помощью соответствующих математических методов.

Систематическая ошибки репрезентативности может возникнуть вследствие нарушения принципов случайного отбора единиц не сплошного наблюдения. Размеры систематической ошибки репрезентативности не поддаются оценке.


  1. Показатели относительного рассеивания

Показатели относительного рассеивания. Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%.

. Коэффициентом осцилляции отражает относительную колеблемость крайних значений признака вокруг средней


.


. Относительное линейное отключение характеризует долю усредненного значения признака абсолютных отклонений от средней величины


.


. Коэффициент вариации:



является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.

В статистике совокупности, имеющие коэффициент вариации больше 30-35 %, принято считать неоднородными.


  1. Макет таблицы. Правила построения таблиц

Первым этапом составления статистической таблицы является ее макет, т.е. таблица, состоящая из строк и граф, которые не заполнены цифрами. Например, необходимо составить макет статистической таблицы, из которой была бы видна зависимость уровня производительности труда, измеряемого средней выработкой продукции на одного работающего, от величины стоимости произведенной на предприятии продукции и стоимости основных фондов на одного работающего. В подлежащем может быть помещен или перечень предприятий, или группировка. В перечне предприятия необходимо расположить в определенном порядке, в данном случае по возрастанию стоимости продукции. Однако, если предприятий много, таблица будет громоздкой и мало наглядной, тогда лучше произвести группировку.

Чтобы определить зависимость производительности труда от стоимости продукции и стоимости основных фондов, следует сгруппировать предприятия по стоимости продукции, а затем полученные группы разбить по стоимости основных фондов на одного работающего и статистическую информацию представить в комбинационной таблице.

После того как намечено подлежащее, необходимо определить сказуемое. Основным показателем производительности труда является средняя выработка продукции на одного работающего. Кроме того, необходимо подсчитать и численность единиц совокупности по каждой группе, т.е. число предприятий в каждой группе, чтобы в итоге получить контрольную цифру - общее число предприятий. На основании приведенных показателей можно вычислить среднюю стоимость продукции на одно предприятие, среднее число работающих на одном предприятии, стоимость продукции на один рубль основных фондов (фондоотдачу). Все эти показатели представляют интерес, но не имеют непосредственного отношения к решаемой задаче, поэтому их не следует включать в таблицу. Таким образом, в сказуемом таблицы будет четыре показателя: средняя выработка продукции на одного работающего, стоимость произведенной продукции, численность работающих и число предприятий.

Перечисленные показатели следует располагать в таблице в определенном порядке. Сначала указывается численность совокупности, в данном случае в первой графе сказуемого таблицы указывается число предприятий, во второй и третьей графах - абсолютные величины: стоимость произведенной продукции и число работающих. В следующих графах после абсолютных показателей помещаются средние и относительные величины, в данном примере - показатель выработки на одного работающего. Такое расположение показателей обеспечивает определенную логическую последовательность при анализе таблицы. После определения последовательности составляется макет таблицы, который заполняется в процессе статистического исследования.

Практикой выработаны следующие основные правила составления и оформления статистических таблиц:

таблица должна быть по возможности небольшой по размерам (такую таблицу легче проанализировать);

название таблицы, заголовки строк и граф должны быть сфорулированы точно и кратко. В статистической таблице указываются единицы измерений. Если все приводимые в таблице данные имеют одну единицу измерения, то она указывается в общем заголовке, если разные - то в заголовках строк или граф, через запятую. В название таблицы указывается территория и период, к которым относятся приводимые данные;

части подлежащего и показатели сказуемого обычно размещаются по принципу от частного к общему, т.е. сначала показываются слагаемые, а в конце подлежащего или сказуемого подводятся итоги. Если приводятся не все слагаемые, то сначала приводятся общие итоги, а затем выделяются наиболее важные их составные части. Для этого после итоговой строки делаются пояснения «в том числе»;

строки и графы в таблице часто нумеруются для того, чтобы удобнее было ссылаться на цифры таблицы. При этом в сказуемом нумеруются только графы, в которые вписываются цифры. Графы подлежащего либо совсем не нумеруются, либо обозначаются буквами;

многозначные абсолютные показатели округляются, округленные числа приводятся в отдельных графах таблицы с одинаковой степенью точности. Когда показатели в процентах выражаются большими числами, целесообразно заменить их выражением «во столько-то раз больше», например, вместо 2500%, записывается в 25 раз больше;

применяются некоторые специальные обозначения: явление не имеет место «-»; отсутствует значение показателя « . » или «н. св.» (нет сведений); величина показателя меньше принятой значности (точности) «0,0» или «0,00»;статистический наблюдение рассеивание отклонение

- если приводятся не только отчетные данные, но и данные, полученные в результате расчетов, об этом делается оговорка в примечании к таблице.


  1. Выборочное наблюдение

Выборочное наблюдение - это один из видов не сплошного наблюдения, при котором учёту подлежит только часть единиц наблюдаемого явления, и отбор единиц в выборочную совокупность производится по определенному закону. Статистические характеристики, полученные на основе выборочного наблюдения - выборочная средняя, выборочная дисперсия и т. д. всегда отличаются по величине от статистических характеристик генеральной совокупности, охватывающей все единицы изучаемого явления.

Разница статистических характеристик генеральной и выборочной совокупности называется ошибкой выборки или репрезентативности и обозначается



где и - соответственно генеральная и выборочная средние.

Величина ошибки выборки средней зависит от числа наблюдений составляющих выборочную совокупность и дисперсии изучаемого признака . Чем больше величина выборки , тем ошибка выборки меньше. Чем больше дисперсия значений признака в выборке , тем больше ошибка выборки. Аналитически это записывается так:


.


Дисперсию доли, как альтернативного признака, определяют по формуле


,


где - доля.

Соответственно ошибка доли определяется по формуле


.


В математической статистике доказано, что с определенной вероятностью p можно утверждать, что при данной дисперсии изучаемого признака и числа наблюдений величина ошибки не превысит определённой заранее заданной величины, называемой предельной ошибкой выборки .

Предельную ошибку средней определяют по формуле:


,


где - коэффициент доверия (отношение предельной и средней ошибки выборки).

Коэффициент доверия определяется по выписке из таблицы значений функции.

Предельную ошибку доли определяют по формуле


.


В зависимости от способа отбора единицы в выборочную совокупность различают следующие виды выборки:

индивидуальную, серийную;

случайную, механическую, типологическую;

повторную, бесповторную.

При бесповторной выборке единица изучаемого явления может попасть в выборку только один раз, при повторном способе отбора единица изучаемого явления может попасть в выборку нескольких раз. Соответственно ошибка выборки при бесповторном отборе рассчитывается по формуле:


,


где - число единиц в генеральной совокупности:

при повторном отборе - по формуле


.


Задаваясь определённой допустимой ошибкой выборки с вероятностью ошибки p и зная дисперсию изучаемого признака , определяют число единиц подлежащих отбору в выборочную совокупность при бесповторном отборе:


;


при повторном отборе:



Выписка из таблицы значение функции при различных значениях :


0,960,6631,700,9111,810,931,940,9480,990,6781,7350,9171,860,9372,000,9551,460,8561,750,921,900,9433,000,997


Ошибки статистического наблюдения Собранные в процессе статистического наблюдения данные по отдельным единицам изучаемой совокупности на после

Больше работ по теме:

КОНТАКТНЫЙ EMAIL: [email protected]

Скачать реферат © 2017 | Пользовательское соглашение

Скачать      Реферат

ПРОФЕССИОНАЛЬНАЯ ПОМОЩЬ СТУДЕНТАМ