вариационный ряд это ряд распределения построенный по какому признаку

Сводка и группировка статистических данных

3.3. Ряды распределения: виды, правила построения, графическое изображение

Ряды распределения делятся на атрибутивные и вариационные, в зависимости от признака, положенного в основу группировки. Если признак качественный, то ряд распределения называется атрибутивным. Примером атрибутивного ряда является распределение предприятий и организаций по формам собственности (см. табл. 3.1).

Если признак, по которому строится ряд распределения, количественный, то ряд называется вариационным.

Вариационные ряды бывают дискретными и интервальными. У дискретных рядов (табл. 3.7) варианты выражены конкретными числами, чаще всего целыми.

Таблица 3.8. Распределение работников по времени работы в страховой компании

Время работы в компании, полных лет (варианты)Число работающих
Человек (частоты)в % к итогу (частости)
до года1511,6
11713,2
21914,7
32620,2
4107,8
51813,9
62418,6
Итого129100,0

Если признак принимает ограниченное число значений, обычно не больше 10, строят дискретные ряды распределения. Если вариант больше, то дискретный ряд теряет свою наглядность; в этом случае целесообразно использовать интервальную форму вариационного ряда. При непрерывной вариации признака, когда его значения в определенных пределах отличаются друг от друга на сколь угодно малую величину, также строят интервальный ряд распределения.

3.3.1. Построение дискретных вариационных рядов

Рассмотрим методику построения дискретных вариационных рядов на примере.

Пример 3.2. Имеются следующие данные о количественном составе 60 семей:

Таблица 3.9.

2 3 3 1 4 2 3 3 1 5 2 4 3 2 2 1 2 3 4 5
2 2 1 3 4 3 3 3 6 6 3 3 6 1 3 4 3 4 4 5
3 3 2 2 1 3 2 5 5 2 4 3 6 1 2 2 3 1 3 4

Для того чтобы получить представление о распределении семей по числу их членов, следует построить вариационный ряд. Поскольку признак принимает ограниченное число целых значений строим дискретный вариационный ряд. Для этого сначала рекомендуется выписать все значения признака (число членов в семье) в порядке возрастания (т.е. провести ранжирование статистических данных):

Таблица 3.10.

1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
3 3 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 6 6 6
Таблица 3.11.

Число членов семьи (х)Число семей (y)
18
214
320
49
55
64
Итого60

3.3.2. Построение интервальных вариационных рядов

Покажем методику построения интервальных вариационных рядов распределения на следующем примере.

Пример 3.3. В результате статистического наблюдения получены следующие данные о средней величине процентной ставки 50 коммерческих банков (%):

Таблица 3.12.

14,719,024,520,812,324,617,014,219,718,8
18,120,521,020,720,414,725,122,719,019,6
19,018,917,420,013,825,613,019,018,721,1
13,320,715,219,921,916,016,915,321,420,4
12,820,814,318,015,123,818,514,414,421,0

Как видим, просматривать такой массив данных крайне неудобно, кроме того, не видно закономерностей изменения показателя. Построим интервальный ряд распределения.

Число интервалов на практике часто задается самим исследователем исходя из задач каждого конкретного наблюдения. Вместе с тем его можно вычислить и математически по формуле Стерджесса

Для нашего примера получим: n = 1 + 3,322lgN = 1 + 3,322lg50 = 6,6 » 7.

Для нашего примера вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Интервалы вариационного ряда наглядны, если их границы имеют «круглые» значения, поэтому округлим величину интервала 1,9 до 2, а минимальное значение признака 12,3 до 12,0.

Интервалы, как правило, записывают таким образом, чтобы верхняя граница одного интервала являлась одновременно нижней границей следующего интервала. Так, для нашего примера получим: 12,0-14,0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24,0-26,0.

Подобная запись означает, что признак непрерывный. Если же варианты признака принимают строго определенные значения, например, только целые, но их количество слишком велико для построения дискретного ряда, то можно создать интервальный ряд, где нижняя граница интервала не будет совпадать с верхней границей следующего интервала (это будет означать, что признак дискретный). Например, в распределении работников предприятия по возрасту можно создать следующие интервальные группы лет: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 и более.

Кроме того, в нашем примере мы могли бы сделать первый и последний интервалы открытыми, т.д. записать: до 14,0; 24,0 и выше.

Таблица 3.13. Ранжированный ряд величин процентной ставки коммерческих банков

Ставка банка % (варианты)
12,317,019,923,8
12,817,420,024,5
13,018,020,024,6
13,318,120,425,1
13,818,520,425,6
14,218,720,5
14,318,820,7
14,418,920,7
14,719,020,8
14,719,021,0
15,119,021,0
15,219,021,1
15,319,021,4
16,019,621,9
16,919,722,7

При подсчете частот может возникнуть ситуация, когда значение признака попадет на границу какого-либо интервала. В таком случае можно руководствоваться правилом: данная единица приписывается к тому интервалу, для которого ее значение является верхней границей. Так, значение 16,0 в нашем примере будет относиться ко второму интервалу.

Результаты группировки, полученные в нашем примере, оформим в таблице.

Таблица 3.14. Распределение коммерческих банков по величине кредитной ставки

Краткая ставка, %Количество банков, ед. (частоты)Накопленные частоты
12,0-14,055
14,0-16,0914
16,0-18,0418
18,0-20,01533
20,0-22,01144
22,0-24,0246
24,0-26,0450
Итого50

В процессе группировки данных при построении вариационных рядов иногда используются неравные интервалы. Это относится к тем случаям, когда значения признака подчиняются правилу арифметической или геометрической прогрессии или когда применение формулы Стерджесса приводит к появлению «пустых» интервальных групп, не содержащих ни одной единицы наблюдения. Тогда границы интервалов задаются произвольно самим исследователем исходя из здравого смысла и целей обследования либо по формулам. Так, для данных, изменяющихся в арифметической прогрессии, величина интервалов вычисляется следующим образом:

Порядок расчетов границ неравных интервалов для данных, изменяющихся приблизительно в арифметической прогрессии, показан в табл. 3.15.

Для показателей, приблизительно изменяющихся в геометрической прогрессии, величину интервалов можно вычислить по формуле

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Для графического изображения интервального ряда используют гистограмму, имеющую вид многоступенчатой фигуры, состоящей из прямоугольников. По оси абсцисс откладывают значения границ интервалов. Сами интервалы будут являться основаниями прямоугольников. Высота прямоугольников соответствует частоте или частости интервалов, которые откладываются по оси ординат.

По данным таблицы, приведенной в примере 3.3, построим гистограмму (рис. 3.2).

При неравных интервалах у гистограммы распределения высотами прямоугольников будут являться показатели плотности распределения, рассчитываемые как частное от деления частоты интервала на его величину.

Зависимость между значениями признака и накопленными частотами показывают особые графики, называемые кумулятой и огивой распределения.

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

В случае интервального ряда при построении кумуляты по оси абсцисс отмечают границы интервальных групп, накопленные частоты по оси ординат относят к верхним границам интервалов.

По данным таблицы, приведенной в примере 3.3, построим кумуляту распределения для интервального ряда (рис. 3.2).

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Если у кумулятивной кривой поменять местами ось абсцисс с осью ординат, получим график, называемый огивой распределения (рис. 3.4).

Источник

Ряды распределения

Понятие о рядах распределения

Среди простых группировок особо выделяют ряды распределения.

Рядом распределения в статистике называется упорядоченное распределение единиц совокупности на группы по какому-либо признаку.

В зависимости от признака положенного в основание ряда распределения различают атрибутивные и вариационные ряды распределения.

Ряды распределения, построенные по описательному признаку, называются атрибутивными рядами.

Пример атрибутивного ряда распределения приведен по данным таблицы 3.5 в таблице 5.1.

Ряд распределения сельскохозяйственных предприятий региона по их организационноправовой форме хозяйствования

Группы предприятий по организационноправовой форме хозяйствованияКоличество предприятий, ед.Удельный вес предприятий, %
Государственные предприятия620
Общества с ограниченной ответственностью1756,7
Фермерские хозяйства723,3
Всего30100,0

Ряды распределения, построенные по количественному признаку, называются вариационными рядами.

В вариационном ряду различают два элемента: варианты и частоты.

Вариантами (х) называются отдельные значения группировочного признака, которые он принимает в вариационном ряду, т.е. конкретные числовые значения признака единиц совокупности.

Числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения, называются частотами (f). Частоты могут быть даны и как относительные величины структуры (в процентах, или долях единицы, или в промилле). В этом случае их называют частостями.

Сумма всех частот определяет численность всей совокупности, т.е. ее объем (N).

По своей конструкции вариационный ряд состоит из двух столбцов: один столбец – значения варьирующего признака, другой – частоты или частости. Макет вариационного ряда приведен в таблице 5.2.

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Для удобства вариационный ряд распределения может быть развернут (см. табл. 4.8). В таблице 4.2 возраст студентов представлен соответствующими вариантами, а число студентов – частотами.

Вариационные ряды по способу построения бывают двух видов: дискретные и интервальные.

Дискретные вариационные ряды характеризуются тем, что варианты в них имеют значения отдельных целых чисел. Пример дискретного вариационного ряда приведен в таблице 4.8.

Если число вариант велико или признак имеет непрерывную вариацию, то объединение значений отдельных наблюдений в группы возможно лишь посредством интервала.

Интервальные вариационные ряды характеризуются тем, что значения вариант в них заданы в виде интервалов.

Пример интервального вариационного ряда распределения приведен по данным таблицы 3.8 в таблице 5.3.

Ряд распределения сельскохозяйственных предприятий региона по урожайности

Группы предприятий по по урожайности (х), ц/гаКоличество предприятий (f), ед.Удельный вес предприятий (f), %
15,8-18,97310
18,97-22,14413,3
22,14-25,311136,7
25,31-28,48723,4
28,48-31,65413,3
31,65-34,8213,3
Всего30100,0

Приведенный в таблице 5.3 вариационный ряд показывает, что наиболее многочисленную группу составляют предприятия с урожайностью от 22,14 ц/га до 25,31 ц/га – 11 предприятий или 36,7 % от всей совокупности. В группах выше и ниже этой группы число предприятий убывает, причем в группах с более высокой урожайностью число предприятий больше. Так, количество предприятий в группах с урожайностью свыше 25,31 ц/га составляет 12 (7 + 4 + 1) или 40 % (23,4 + 13,3 + 3,3), а в группах ниже 22,14 ц/га – 7 (3 + 4) предприятий или 23,3 % (10 + 13,3).

Если вариационный ряд имеет группы с неравными интервалами, то частоты в отдельных интервалах непосредственно не сопоставимы, так как зависят от ширины интервала. Для того чтобы частоты можно было бы сравнить исчисляют плотность распределения – частоту (т.е. число единиц совокупности), рассчитанную на единицу ширины интервала.

Пример расчета плотности распределения приведен в таблице 5.4.

Ряд распределения работников предприятия по возрасту

Возраст работников, летЧисло работников, чел.Плотность распределения, чел./год
16-1821,0 (2 : (18-16) = 2 : 2)
18-25121,7
25-45201
45-60261,7
60-6551
Всего65

Для изображения вариационных рядов применяются линейные и плоскостные диаграммы, построенные в прямоугольной системе координат.

При дискретной вариации признака графиком вариационного ряда служит полигон распределения. Графическим изображением интервальных вариационных рядов служит гистограмма.

При неравных интервалах гистограмма строится только по плотности распределения. При построении графиков рядов распределения по оси абсцисс приводятся варианты, а по оси ординат – соответствующие им частоты (частости).

Примеры полигона распределения и гистограммы, построенные по данным таблиц 4.8, 5.3 и 5.4, приведены на рис. 5.1.

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Для иллюстрации рядов распределения используются также кумуляты и огивы. Для их построения на оси абсцисс отмечаются значения дискретного признака (или концы интервалов), а на оси ординат – нарастающие итоги частот (кумулята) или частостей (огива), соответствующих этим значениям признака.

Кумулята распределения студентов по возрасту приведена на рис. 5.2.

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Вариационные ряды дают возможность установить характер распределения единиц совокупности по тому или иному количественному признаку с помощью расчета четырех видов характеристик (групп показателей), указанных на рис. 5.3.

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Анализ показателей, характеризующих центральную тенденцию ряда распределения, степень вариации, дифференциации и концентрации значений варьирующего признака, а также форму их распределения, позволяет дать комплексную оценку характера распределения единиц совокупности (комплексную характеристику строения исследуемого социально-экономического явления).

Мода и медиана

Для характеристики центральной тенденции (положения центра) ряда распределения кроме средней арифметической величины применяются структурные средние: медиана и мода, используемые для изучения внутреннего строения рядов распределения значений признаков.

В отличие от средней арифметической, рассчитываемой на основе всех вариант, мода и медиана характеризуют значение признака у единицы совокупности, занимающей определенное положение в вариационном ряду распределения.

Медиана – значение признака единицы совокупности, стоящей в середине упорядоченного ряда и делящей совокупность на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой – не меньше его.

Медиану используют как наиболее надежный показатель типичного значения признака единиц неоднородной совокупности, так как она нечувствительна к крайним значениям признака, которые могут значительно отличаться от основного массива его значений.

В дискретном вариационном ряду медианой следует считать значение признака в той группе единиц совокупности, в которой накопленная частота превышает половину численности совокупности. Например, по данным таблицы 4.8 медиана равна 19 лет (2 + 11 > 20 : 2).

При четном числе единиц совокупности за медиану принимают арифметическую среднюю величину из двух центральных вариант, например при десяти значениях признака – среднюю из пятого и шестого значений в ранжированном ряду.

В интервальном вариационном ряду для нахождения медианы (Ме) применяется формула:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где хМе – нижняя граница интервала, в котором находится медиана (медианного интервала);
iМе – величина медианного интервала;
Σfi – сумма частот ряда;
S(Ме – 1) – накопленная частота в интервале, предшествующем медианному;
fМе – частота медианного интервала.

При нечетном числе единиц совокупности номер медианы равен не Σfi /2, а (Σfi + 1)/2.

Пример расчета медианы

По данным таблицы 4.13 следует найти медианное значение заработной платы работников предприятия. Для этого предварительно рассчитаем значения накопленных частот для каждого интервала, приведенные в таблице 5.5.

Накопленные частоты ряда распределения работников предприятия по уровню заработной платы

Группы работников по уровню заработной платы, руб.Число работников, чел. (fi)Накопленная частота, чел. (SМе)
8000-100002020
10000-1200080100 (20 + 80)
12000-14000160260 (100 + 160)
14000-1600090350 (260 + 90)
16000-1800040390 (350 + 40)
18000 и выше10400 (390 + 10)
Всего400

Медианным является срединное из 400 значений ряда распределения, т. е. 200-е от начала ряда распределения значение заработной платы (400 : 2), которое находится в третьем интервале, что видно из ряда накопленных частот (260 >200). Третий интервал является медианным.

По формуле 5.1: Ме = 13250 руб., т. е. одна половина работников предприятия имеет заработную плату меньше 13250 руб., а другая – больше.

Модой называется варианта (значение признака), которая в изучаемом ряду распределения встречается чаще всего.

Например, в дискретном вариационном ряду это варианта, имеющая наибольшую частоту.

По данным таблицы 4.8 мода также равна 19 лет, так как это наиболее часто встречающийся возраст студентов в их группе (11 человек).

Если два или несколько значений признака встречаются равное количество раз, вариационный ряд считается бимодальным или мультимодальным. Это говорит о неоднородности совокупности.

В интервальном вариационном ряду модальным интервалом является интервал с наибольшей частотой. Внутри этого интервала находят условное значение признака, вблизи которого плотность распределения, т. е. число единиц совокупности, приходящееся на единицу измерения варьирующего признака, достигает максимума. Это условное значение считается точечной модой.

В интервальном вариационном ряду для нахождения моды (Мо) применяется формула:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где хМо – нижняя граница модального интервала (наиболее часто встречающегося);
iМо – величина модального интервала;
fМо – частота модального интервала;
f(Мо – 1) – частота интервала, предшествующего модальному;
f(Мо + 1) – частота интервала, следующего за модальным.

Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и др.

Пример расчета моды

По данным таблицы 4.13 нужно найти модальное значение заработной платы работников предприятия.

Модальным является третий интервал, имеющий наибольшую частоту (160 чел.).

По формуле 5.2: Мо = 13066,67 руб., т.е. наибольшее число работников предприятия имеет заработную плату 13066,67 руб.

При выборе конкретного показателя центра распределения исходят из таких рекомендаций:

– для устойчивых социально-экономических процессов (однородных совокупностей) в качестве показателя центра используют среднюю арифметическую величину. Такие процессы характеризуются симметричными распределениями, в которых х = Ме = Мо;

– для неустойчивых процессов положение центра распределения характеризуется с помощью моды или медианы. Для асимметричных процессов предпочтительной характеристикой центра распределения является медиана, поскольку занимает положение между средней арифметической величиной и модой: х х > Ме > Мо.

Показатели вариации

При определении общего характера распределения важнейшей задачей является оценка степени его однородности. Однородность статистических совокупностей характеризуется величиной вариации значений признака.

Вариация, т.е. несовпадение уровней значений признаков у единиц совокупности, имеет объективный характер, так как численный уровень значений признака определяется конкретными условиями, в которых находится каждая из изучаемых единиц совокупности, а также особенностями их развития. Вариация помогает познать сущность изучаемого явления.

Для измерения вариации в статистике применяют несколько способов.

Наиболее простым является расчет показателя «размах вариации» (R), представляющего собой разницу между максимальным и минимальным значением наблюдаемого признака, по формуле:

где хmax и хmin – соответственно, максимальное и минимальное значение признака в исследуемой срвокупности.

Размах вариации охватывает только крайние отклонения значений признака, но не отражает отклонений от средней величины всех вариант в ряду. Чем больше размах вариации, тем менее однородна исследуемая совокупность.

Точнее характеризуют вариацию признака показатели, основанные на учете колеблемости (отклонений) всех значений признака от его среднего уровня. От величины этих отклонений зависит типичность и надежность средних характеристик исследуемой совокупности.

Средние отклонения значений признаков каждой единицы совокупности от среднего значения признака в целом отражают показатели вариации. Показатели вариации используют для оценки степени однородности исследуемой совокупности по варьирующему признаку и типичности средней величины.

Простейший показатель такого типа – среднее линейное отклонение, представляющее собой среднее арифметическое значение абсолютных отклонений признака от его среднего уровня.

Среднее линейное отклонение ( d ) по несгруппированным данным рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Среднее линейное отклонение ( d ) по сгруппированным данным рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Чем меньше среднее линейное отклонение, тем более однородны значения признака изучаемого явления.

Основной недостаток показателя среднего линейного отклонения заключается в том, что при его расчетах пренебрегают знаками, следовательно, конечный результат получается со значительной погрешностью. Для того чтобы расчет был более точным, определяют средний квадрат отклонений (дисперсию), представляющий собой средний квадрат отклонений значений признака от его среднего уровня.

Дисперсия (σ 2 ) по несгруппированным данным рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Дисперсия (σ 2 ) по сгруппированным данным рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Среднее квадратическое отклонение (σ) рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Среднее квадратическое отклонение является абсолютной мерой вариации и зависит не только от степени вариации признака, но и от абсолютных уровней вариант и средней, что не позволяет непосредственно сравнивать средние квадратические отклонения вариационных рядов с разными уровнями. Среднее квадратическое отклонение выражается в тех же единицах измерения, что и усредняемые значения признака исследуемой совокупности.

Для сравнительной характеристики вариационных рядов с разными уровнями по степени надежности их средней величины и однородности исследуемых совокупностей рассчитывается относительная мера вариации – коэффициент вариации.

Коэффициент вариации (V) в процентном выражении рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Чем больше значение коэффициента вариации, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна (типична) средняя величина.

Вместе с тем, конкретное значение коэффициента вариации не всегда позволяет однозначно характеризовать степень ее интенсивности и однородность исследуемой совокупности. Оценка степени интенсивности вариации должна учитывать особенности единиц наблюдения и признаков, их характеризующих. В частности, для совокупности сельхозяйственных предприятий вариация урожайности в одном и том же природном регионе может быть оценена как слабая, если V 25%. Напротив, вариация роста в совокупности взрослых мужчин или женщин уже при V = 7%, должна быть оценена и восприниматься как сильная.

Таким образом, оценка интенсивности вариации состоит в сравнении наблюдаемой вариации с некоторой обычной ее интенсивностью, принимаемой за норматив. Если различия в урожайности, заработной плате или доходе на душу населения в несколько раз воспринимаются как вполне естественные, то различия в росте людей хотя бы в полтора раза уже воспринимаются как очень сильные.

Пример расчета показателей вариации

По данным таблицы 4.13 необходимо охарактеризовать ряд распределения работников предприятия по заработной плате на предмет его однородности и типичности среднего значения уровня заработной платы для работников предприятия.

По формуле 5.3 размах вариации (R = 20000 – 8000 = 12000 руб.), т.е. разница между максимальным и минимальным уровнем оплаты труда на предприятии составляет 12000 руб. На первый взгляд это достаточно большой разброс в оплате труда работников предприятия, т.е. исследуемая совокупность не однородна по уровню оплаты труда. Данное предположение подтвердится или нет последующими расчетами. Отметим, что верхнюю границу последнего открытого интервала определили исходя их величины смежного с ним интервала, которая равна 2000 руб. (18000 – 16000), 18000 + 2000 = 20000 руб.

Расчет среднего линейного отклонения проведем с помощью данных таблицы 5.6.

Данные для расчета среднего линейного отклонения заработной платы работников предприятия

Группы работников по уровню заработной платы, руб.Число работников, чел. (fi)Середина интервала, руб. (xi)|xi— X ||xi— X | × fi
8000-10000209000440088000
10000-1200080110002400192000
12000-140001601300040064000
14000-1600090150001600144000
16000-1800040170003600144000
18000 и выше1019000560056000
Всего400688000

Средняя заработная плата работников предприятия, рассчитанная по формуле 4.22 ( X ), равна 13400 руб.

По формуле 5.5: d = 1720 руб.

Расчет дисперсии (среднего квадрата отклонений) и среднего квадратического отклонения проведем с помощью данных таблицы 5.7

Данные для расчета среднего квадрата отклонений заработной платы работников предприятия

Группы работников по уровню заработной платы, руб.Число работников, чел. (fi)Середина интервала, руб. (xi)(xi— X ) 2(xi— X ) 2 × fi
8000-1000020900019360000387200000
10000-1200080110005760000460800000
12000-140001601300016000025600000
14000-1600090150002560000230400000
16000-18000401700012960000518400000
18000 и выше101900031360000313600000
Всего4001936000000

По формуле 5.7: σ 2 = 4840000.

По формуле 5.8: σ = 2200 руб.

На основании полученных показателей вариации трудно с уверенностью оценить однородность работников предприятия по уровню их заработной платы.

По формуле 5.9: V = 16,4%, что говорит о достаточной однородности исследуемой совокупности по уровню зарплаты и типичности ее среднего уровня.

Дисперсия обладает рядом математических свойств, упрощающих технику ее расчета. В частности:

Эти свойства положены в основу расчета дисперсии способом моментов. Способ моментов применим в том случае, если задан интервальный ряд с равными интервалами.

Дисперсия методом моментов рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где h – шаг интервала; m’, m» – соответственно моменты первого и второго порядка. Момент первого порядка рассчитывается по формуле 4.32. Момент второго порядка рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Пример расчета дисперсии методом моментов

На основе данных таблицы 4.13 рассчитаем дисперсию методом моментов. Для этого построим вспомогательную таблицу 5.8, используя данные таблицы 4.15 и комментарии к ней.

Данные для расчета дисперсии заработной платы работников предприятия способом моментов

Группы работников по уровню заработной платы, руб.Число работников, чел. (fi)Середина интервала, руб. (xi)(xi-A)/h[(xi-A)/h] 2[(xi-A)/h] 2 × fi
8000-10000209000-2480
10000-120008011000-1180
12000-1400016013000000
14000-1600090150001190
16000-18000401700024160
18000 и выше10190003990
Всего400500

По формуле 4.32: m’ = 0,2.

По формуле 5.11: m» = 1,25.

По формуле 5.10: σ 2 = 4840000, что равно значению дисперсии, полученному по данным таблицы 5.7, по формуле 5.7.

Для расчета дисперсии в любых рядах распределения (дискретных и интервальных с равными и неравными интервалами) применяется другой упрощенный метод расчета дисперсии – способ разности.

Дисперсия способом разности рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где x – среднее значение варьирующего признака, исчисленное по формуле 4.22;

x 2 – среднее значение квадратов вариант, рассчитываемое по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Пример расчета дисперсии методом разности

Дисперсию методом разности рассчитаем по данным таблицы 4.13.

Средняя заработная плата работников предприятия, исчисленная ранее: x = 13400 руб.

Для расчета среднего значения квадратов вариант составим вспомогательную таблицу 5.9.

Данные для расчета средней величины квадратов значений зарплаты работников предприятия

Группы работников по уровню заработной платы, руб.Число работников, чел. (fi)Середина интервала, руб. (xi)xi 2xi 2 × fi
8000-10000209000810000001620000000
10000-1200080110001210000009680000000
12000-140001601300016900000027040000000
14000-16000901500022500000020250000000
16000-18000401700028900000011560000000
18000 и выше10190003610000003610000000
Всего40073760000000

По формуле 5.13: x 2 = 184400000.

По формуле 5.12: σ 2 = 184400000 – 13400 2 = 4840000, что совпадает со значения дисперсии, найденными другими способами.

Виды дисперсии. Понятие об эмпирическом коэффициенте детерминации и эмпирическом корреляционном отношении

Вариация признака определяется различными факторами, в результате чего различают общую дисперсию, межгрупповую дисперсию и внутригрупповую дисперсию.

Общая дисперсия (σ 2 ) измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию.

Вместе с тем, благодаря методу группировок можно выделить и измерить вариацию, обусловленную группировочным признаком, и вариацию, возникающую под влиянием неучтенных факторов.

Межгрупповая дисперсия (σ 2 м.гр) характеризует систематическую вариацию, т. е. различия в величине изучаемого признака, возникающие под влиянием признака – фактора, положенного в основание группировки, и рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где k – количество групп, на которые разбита вся совокупность;
mj – количество объектов, наблюдений, включенных в группу j;
x j – среднее значение признака по группе j;
x – общее среднее значение признака.

Внутригрупповая дисперсия (σ 2 j,вн.гр) отражает случайную вариацию, т.е. часть вариации, возникающую под влиянием неучтенных факторов и независящую от признака-фактора, положенного в основание группировки, и рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

или, на основе метода разностей, по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где xij – значение i-ой варианты в группе j.

Если в сформированных группах отдельные данные встречаются не один раз, то для расчета внутригрупповой дисперсии используется формула средней арифметической взвешенной.

Среднее значение внутригрупповых дисперсий рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Существует закон, согласно которому общая дисперсия, возникающая под воздействием всех факторов, равна сумме дисперсии, возникающей за счет группировочного признака и дисперсии, появляющейся под влиянием всех прочих факторов.

Правило сложения дисперсий выражается формулой:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Правило сложения дисперсии широко применяется при исчислении тесноты связей между признаками (факторным и результативным). Для этого определяют эмпирический коэффициент детерминации и эмпирическое корреляционное отношение.

Эмпирический коэффициент детерминации показывает, какая доля всей вариации признака обусловлена признаком, положенным в основание группировки.

Эмпирический коэффициент детерминации (η 2 ) рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Эмпирическое корреляционное отношение показывает тесноту связи между признаками – группировочным и результативным.

Эмпирическое корреляционное отношение (η) рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Оно изменяется в пределах от 0 до 1. Характеристика связи между признаками при соответствующих значениях эмпирического корреляционного отношения приведена в таблице 5.10.

Качественная оценка связи между признаками

Значение η00-0,20,2-0,30,3-0,50,5-0,70,7-0,90,9-0,991
Характеристика связиотсутствуеточень слабаяслабаяумереннаязаметнаятеснаяочень теснаяфункциональная

Пример расчета общей, межгрупповой и внутригрупповой дисперсии, эмпирического коэффициента детерминации и эмпирического корреляционного отношения

Вариация урожайности зерновых культур сельскохозяйственных предприятий одного региона (см. табл. 3.3) обусловлена влиянием различных факторов: качеством земель, погодными условиями, уровнем агрокультуры и т.п. Уровень агрокультуры и состояние технической базы сельхозпроизводства определяется, в частности, организационно-правовой формой хозяйствования (предприятия).

По результатам комбинационной группировки сельскохозяйственных предприятий (см. табл. 3.10) можно предположить наличие зависимости урожайности от организационно-правовой формы предприятия. Необходимо оценить тесноту связи между урожайностью зерновых культур сельхозпредприятий и их организационно-правовой формой. В данном случае организационноправовая форма хозяйствования является группировочным фактором, урожайность зерновых культур – результативным.

По данным столбцов А, Б и 1 таблицы 3.10 построим таблицу 5.11, представляющую собой группировку сельскохозяйственных предприятий, имеющих разную урожайность зерновых культур, по их организационно-правовой форме.

Для расчета общей и внутригрупповых дисперсий составим таблицу 5.12.

В качестве хi примем середины интервалов урожайности зерновых культур, приведенных в табл. 5.11.

Средняя урожайность, рассчитанная по всей совокупности предприятий по формуле 4.22: 24,57 ц/га.

Группировка сельскохозяйственных предприятий с разной урожайностью зерновых культур по организационно-правовой форме хозяйствования

Урожайность, ц/га
i)
Количество предприятий, ед.
(fi 0)
В том числе
государственных предприятий
(fi 1)
обществ с ограниченной ответственностью
(fi 2)
фермерских хозяйств
(fi 3)
15,8-18,97321
18,97-22,1444
22,14-25,311138
25,31-28,487133
28,48-31,65413
31,65-34,8211
Всего306177

Данные для расчета общей и групповых дисперсий

хi, ц/гаrowspan=2>fi 0хi × fi 0i— х0 ) 2 × fi 0Государственные предприятия
fi 1хi × fi 1i— х1 ) 2 × fi 1
1234567
17,385352,155154,87234,77045,22
20,555482,22064,48
23,72511260,9757,85371,1757,54
26,8957188,26537,84126,89522,61
30,0654120,260120,78
33,235133,23575,08
Всего30737,110460,906132,84075,37

Продолжение таблицы 5.12

хi, ц/гаОбщества с ограниченной ответственностьюФермерские хозяйства
fi 2хi × fi 2i— х2 ) 2 × fi 2fi 3хi × fi 3i— х3 ) 2 × fi 3
18910111213
17,385117,38537,88
20,555482,22035,64
23,7258189,8000,27
26,895380,68533,77380,68515,39
30,065130,06542,58390,1952,46
33,235133,23516,61
Всего17400,155150,147204,11534,46

Значения показателей средней урожайности зерновых культур государственных предприятий, обществ с ограниченной ответственностью и фермерских хозяйств не совпадали со значениями этих же показателей, рассчитанными по формуле 4.18 в примере п. 4.4 (с. 64), что обусловлено разными методиками расчета средних величин. Однако они отражают общую тенденцию соотношения урожайности зерновых культур предприятий различных организационно-правовых форм одного региона и дают точный результат при оценке тесноты связи между факторным и результативным показателями.

Общая дисперсия урожайности по всей совокупности предприятий региона, рассчитанная по формуле 5.7: 15,4.

Дисперсия урожайности (формула 5.7):

Межгрупповая дисперсия, рассчитанная по формуле 5.14: 6,7.

Средняя из внутригрупповых дисперсий, рассчитанная по формуле 5.17: 8,7.

Полученные результаты отвечают правилу сложения дисперсий (формула 5.18):

Для оценки тесноты связи между урожайностью и организационно-правовой формой сельхозпредприятий исчислим эмпирический коэффициент детерминации и эмпирическое корреляционное отношение.

Эмпирический коэффициент детерминации, рассчитанный по формуле 5.19: 0,435.

Эмпирический коэффициент детерминации показывает, что 43,5% вариации урожайности зерновых культур сельхозпредприятий региона обусловлено их организационно-правовой формой.

Эмпирическое корреляционное отношение, рассчитанное по формуле 5.20: 0,66.

Полученное значение свидетельствует о заметной связи между урожайностью зерновых культур сельскохозяйственных предприятий региона и их организационно-правовой формой хозяйствования (см. табл. 5.10).

Показатели дифференциации и концентрации распределения

Структуру вариационного ряда характеризуют значения признака, аналогичные медиане, которые называются квантилями или градиентами.

Квантили (градиенты) – это значения признака, которые делят все единицы ряда распределения на равные по численности группы. Частные случаи квантилей приведены на рис. 5.4.

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Квантили используются для характеристики степени различия значений уровней признака единиц вариационного ряда, относящихся к выделенным группам. На основании значений квантилей рассчитывают коэффициенты дифференциации: квартильный коэффициент, квинтильный коэффициент, децильный коэффициент, коэффициент фондов, широко используемые при изучении дифференциации доходов населения.

Для расчета квартильного, квинтильного и децильного коэффициентов рассчитываются соответственно первые и последние квартили, квинтили и децили.

Отметим, что второй квартиль (Q2) равен медиане, а первый (Q1) и третий (Q3) квартили исчисляются аналогично расчету медианы, только вместо медианного интервала берется для первого квартиля интервал, в котором находится варианта, отсекающая ¼ численности частот, а для третьего квартиля – варианта, отсекающая ¾ частот.

Первый квартиль (Q1) рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

третий квартиль (Q3) рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где xQ1 – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25%);
xQ3 – нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75%);
iQ – величина интервала (квартильного);
SQ1-1 – накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;
SQ3-1 – накопленная частота интервала, предшествующего интервалу, содержащему верхний квартиль;
fQ1 – частота интервала, содержащего нижний квартиль;
fQ3 – частота интервала, содержащего верхний квартиль.

Пример расчета квартилей

По данным таблицы 4.13, используя данные таблицы 5.5, необходимо рассчитать квартили ряда распределения работников предприятия по уровню заработной платы.

Первый квартиль находится во втором интервале (10000-12000), так как его накопленная частота (100 чел.) равна ¼ численности всех работников предприятия (400 : 4 = 100).

По формуле 5.21: Q1 = 12000 руб., т. е. одна четверть работников предприятия получает заработную плату меньше 12000 руб.

Третий квартиль находится в четвертом интервале (14000-16000), так как его накопленная частота (350 чел.) превышает 3/4 численности всех работников предприятия (400 : 4 × 3 = 300).

По формуле 5.2: Q3 = 14888,89 руб., т. е. три четверти работников предприятия получают заработную плату меньше 14889 руб., одна четверть – больше.

Методика расчета квинтилей, децилей и других квантилей аналогична расчету квартилей.

Пример расчета децилей

По данным таблицы 4.13, используя данные таблицы 5.5, необходимо рассчитать децили ряда распределения работников предприятия по уровню заработной платы.

Первый дециль, величина которого означает, что 10% единиц совокупности имеют значения ниже этого значения, находится во втором интервале (10000-12000), так как его накопленная частота (100 чел.) превышает численности всех работников предприятия (400 : 10 = 40).

Адаптировав формулу 5.21 к нижнему децилю, рассчитаем его значение: d1 = 10500 руб., т. е. 10% работников предприятия получает заработную плату ниже 10500 руб.

Девятый дециль, величина которого означает, что 10% единиц совокупности имеют значения выше этого значения, находится в пятом интервале (16000-19000), так как его накопленная частота (390 чел.) превышает 9/10 численности всех работников предприятия (400 : 10 × 9 = 360).

Адаптировав формулу 5.22 к верхнему децилю, рассчитаем его значение: d9 = 16500 руб., т. е. 10% работников предприятия получает заработную плату выше 16500 руб.

Методики расчета и сущностная характеристика коэффициентов дифференциации приведены в таблице 5.13.

Общая характеристика коэффициентов дифференциации

Название показателяФормула для расчета№ формулыСущностная характеристика
Квартильный коэффициентKQ = Q3/Q15.23характеризует соотношение между верхним и нижним квартилями и показывает во сколько раз минимальное значение признака в последней четверти единиц совокупности выше максимального значения признака в первой четверти единиц совокупности
Децильный коэффициентKd = d9/d15.24характеризует соотношение между верхним и нижним децилями
Коэффициент фондов (фондовый коэффициент)Kф = x10 / x15.25определяется как соотношение между средними уровнями значений признака внутри сравниваемых групп, находящихся в разных концах ряда распределения. Он более точно измеряет уровень дифференциации
Формула соответствует случаю, если ряд распределения разбит на десять частей, при этом x10 и x1 – соответственно среднее значение признака в десятой и первой частях ряда распределения.

В статистической практике эти показатели используются в статистике доходов населения (домашних хозяйств) как показатели распределения денежных доходов, характеризующие степень превышения минимального среднедушевого дохода соответствующей квантильной части наиболее обеспеченного населения над максимальным среднедушевым доходом части наименее обеспеченного населения. Например, децильный коэффициент показывает, во сколько раз минимальный среднедушевой денежный доход 10% наиболее обеспеченной части населения превышает максимальный среднедушевой денежный доход 10% наименее обеспеченного населения.

Пример расчета квартильного и децильного коэффициентов

По данным таблицы 4.13 и примеров расчета квартилей и децилей необходимо рассчитать квартильный и децильный коэффициенты.

По формуле 5.23: KQ = 1,24, т.е. минимальное значение заработной платы одной четверти наиболее высокооплачиваемых работников предприятия в 1,24 раза превышает максимальное значение заработной платы одной четверти низкооплачиваемых работников.

По формуле 5.24: Kd = 1,57, т.е. минимальное значение заработной платы 10% наиболее высокооплачиваемых работников предприятия в 1,57 раза превышает максимальное значение заработной платы 10 % работников с наименьшим уровнем оплаты труда на предприятии, что характеризует незначительный разрыв в оплате труда работников предприятия.

Фактические статистические данные, характеризующие распределение совокупного дохода домашних хозяйств Российской Федерации по квантильным группам в зависимости от уровня среднедушевых денежных доходов (в расчете в среднем на члена домохозяйства) в месяц, за 2011-2017 гг. приведены в таблице 5.14.

Среднемесячный совокупный доход домашних хозяйств Российской Федерации в среднем на члена домохозяйства, в том числе по квантильным группам в зависимости от уровня среднедушевых денежных доходов, за 2011-2017 гг., руб.

Квантильные группы в зависимости от уровня среднедушевых денежных доходов2011г.2013г.2015г.2017г.
Квинтильные группы:
– 1 группа (с наименьшими денежными доходами)6617,57465,38507,69224,9
– 2 группа11481,313271,815030,315904,1
– 3 группа16432,818762,521383,222269,2
– 4 группа23622,126770,730482,031352,0
– 5 группа (с наибольшими денежными доходами)45362,851679,456631,757907,0
Децильные группы:
– 1 группа (с наименьшими денежными доходами)4994,35566,86426,47052,1
– 2 группа8240,79363,810588,811397,7
– 3 группа10369,511990,913592,414491,4
– 4 группа12593,014552,716468,217316,7
– 5 группа15074,517206,219569,520467,2
– 6 группа17791,020318,723196,924071,2
– 7 группа21278,724128,927758,128406,0
– 8 группа25965,429412,433205,934298,0
– 9 группа34038,437406,142620,843856,3
– 10 группа (с наибольшими денежными доходами)56687,265952,670642,571957,6
Все домохозяйства20703,323588,726406,927331,4

Если показатели дифференциации характеризуют степень различия значений признаков единиц совокупности, распределенных в равных по численности группах, то показатели концентрации отражают неравномерность распределения значений признака единиц вариационного ряда в равноинтервальных группах, степень сосредоточения (концентрации) значений признака единиц совокупности в отдельных группах.

Чем выше значения показателей концентрации распределения, тем выше неравномерность распределения единиц совокупности на группы по обусловленному признаку, тем менее однородна по этому признаку исследуемая совокупность.

К показателям концентрации относятся коэффициент концентрации Джини, коэффициент Герфиндаля, коэффициент Розенблюта и др.

Коэффициент концентрации Джини (G) используется для характеристики степени неравномерности распределения значений признака вариационного ряда и рассчитываетсят по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где pi – накопленная частость (доля) численности единиц совокупности; qi – накопленная доля значений признака i-ой группы, приходящихся на все единицы совокупности. Доля значений признака i-ой группы (di) рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

n – число групп в совокупности.

Коэффициент концентрации Джини может принимать значения от 0 до 1, поэтому результат следует разделить либо на 100, если pi или qi выражены в процентах, либо на 10000, если оба показателя выражены в процентах.

Удаление значения коэффициента Джини от нуля свидетельствует о возрастании степени неравномерности распределения значений признака в вариационном ряду и концентрации значений признака в отдельных группах.

Более простой показатель концентрации – коэффициент Герфиндаля, рассчитываемый на основе данных о доле суммарных значений признаков отдельных групп (выраженных, как правило, абсолютными величинами) в совокупном объеме значений признака.

Коэффициент Герфиндаля (H) рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где доля значений признака i-ой группы в общем объеме значений признака, т.е. di, рассчитанное по формуле 5.27.

Значение коэффициента Герфиндаля определяется влиянием только доминирующих групп, так как группы с незначительной долей значений признака, которая при возведении в квадрат выражается незначащим числом, ощутимого влияния на значение коэффициента не оказывают. Механизм расчета коэффициента Герфиндаля позволяет выделить доминирующие в совокупности группы как наиболее весомые составляющие значения Н.

Основное достоинство коэффициента Герфиндаля – его высокая чувствительность к изменению в совокупном объеме долей наиболее крупных единиц совокупности, что позволяет отслеживать концентрацию значений признака. Другое достоинство данного коэффициента заключается в том, что он реагирует на число единиц в группе. Однако ее наибольшим значениям придается наибольший вес. Вследствие этого существует опасность преувеличения уровня концентрации.

Поэтому наряду с коэффициентом Герфиндаля целесообразно применять коэффициент Розенблюта, который также характеризует концентрацию, однако расставляет акценты в обратном порядке: наибольший вес придается группам с наименьшими долями.

Коэффициент Розенблюта (KR) рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где i – номер группы в совокупности;
di – доля i-ой группы в общем объеме совокупности;
n – число групп в совокупности.

Диапазон значений коэффициента Розенблюта 0 ≤ KR ≤ 1. KR = 1 при n = 1 и d1 = 1. В целом коэффициент Розенблюта имеет тенденцию преуменьшать концентрацию в совокупности.

Пример расчета показателй концентрации распределения

По данным таблицы 4.13 следует оценить степень концентрации (или неравномерность) распределения работников предприятия по уровню их заработной платы.

Характеристика неравномерности распределения работников предприятия по уровню их заработной платы и их концентрации в отдельных группах осуществляется на основе расчета коэффициентов Джини, Герфиндаля и Розенблюта

Для расчета коэффициента концентрации Джини построим таблицу 5.15.

Данные для расчета коэффициента концентрации Джини

Группы работников по уровню заработной платы, руб.Середина интервала, руб. (xi)Число работников, чел. (fi)Удельный вес (частость) работников, %Накопленная частость, % (pi)xi × fi, руб.di, %qi, %pi × qi+1pi+1 × qi
8000-10000900020551800003,43,485
10000-120001100080202588000016,419,8991287
12000-14000130001604065208000038,858,614655128
14000-16000150009022,587,5135000025,283,854478171
16000-1800017000401097,568000012,796,584449650
18000 и выше19000102,51001900003,51009750
Всего400100,05360000100,02520524321

По формуле 5.26, с учетом того, что pi и qi были выражены в процентах, G = (25205 – 24321): 10000 = 0,09, что свидетельствует о достаточно равномерном распределении работников предприятия по уровню заработной платы по выделенным группам и слабой концентрации значений заработной платы в отдельных их них.

Для расчета коэффициентов концентрации Герфиндаля и Розенблюта построим таблицу 5.16.

По формуле 5.28: H = 0,2594.

По формуле 5.29: KR = 0,174.

Данные для расчета коэффициентов концентрации Герфиндаля и Розенблюта

Группы работников по уровню заработной платы, руб.Середина интервала, руб. (xi)Число работников, чел. (fi)xi × fi, руб.di, выраженная в форме коэффициентаdi 2ii × di
8000-100009000201800000,0340,001210,034
10000-1200011000808800000,1640,026920,328
12000-1400013000160208000003880,150531,164
14000-16000150009013500000,2520,063541,008
16000-1800017000406800000,1270,016150,635
18000 и выше19000101900000,0350,001260,21
Всего40053600001,0000,25943,379

Совместная интерпретация полученных значений коэффициентов Герфиндаля и Розенблюта позволяет сделать вывод об умеренной концентрации значений заработной платы в отдельных группах работников предприятия.

Понятие о закономерностях распределения

Между изменением значений варьирующего признака и их частотами существует определенная зависимость. Как правило, частоты в вариационных рядах с ростом значения варьирующего признака первоначально увеличиваются, а затем после достижения какой-то максимальной величины в середине ряда уменьшаются (см. табл. 4.13 и 5.3). Значит, частоты в этих рядах изменяются закономерно в связи с изменением варьирующего признака.

Анализ вариационных рядов предполагает выявление закономерностей распределения, определение и построение (получение) некой теоретической (вероятностной) формы распределения.

Графическое изображение вариационного ряда принимает вид плавной кривой, именуемой кривой распределения.

Примером фактической кривой распределения является полигон распределения, поскольку в нем отражаются как общие, так и случайные условия, определяющие распределение.

Из математической статистики известно, что при увеличении объема статистической совокупности (Ν → ∞) и одновременном уменьшении интервала группировки (h → 0) полигон либо гистограмма распределения все более и более приближаются к некоторой плавной кривой, являющейся для указанных графиков пределом. Эта кривая называется эмпирической кривой распределения и представляет собой графическое изображение в виде непрерывной линии изменения частот, функционально связанного с изменением вариант.

Эмпирические кривые распределения, построенные на основе, как правило, относительно небольшого числа наблюдений (т.е. фактические кривые распределения), очень трудно описать аналитически. Поэтому для выявления статистических закономерностей, сравнения и обобщения различных совокупностей аналогичных данных используются теоретические распределения.

Теоретические распределения – это хорошо изученные в теории распределения, представляющие собой зависимости между плотностями распределения и значениями признака, отражающие закономерности распределения. Они описываются статистическими функциями, параметры которых вычисляются по статистическим характеристикам изучаемой совокупности.

Теоретической кривой распределения называется такая кривая распределения, которая выражает общую закономерность данного типа распределения в чистом виде, исключающем влияние случайных для данного типа закономерностей факторов.

Исследование формы распределения предполагает замену эмпирического распределения известным теоретическим, близким ему по форме. При этом необходимо соблюдать условие: различия между эмпирическим и теоретическим распределением должны быть минимальными. Это означает, что сумма частот эмпирического распределения должна соответствовать сумме частот теоретического распределения. Теоретическое распределение в этом случае является некоторой идеализированной моделью эмпирического распределения, и анализ вариационного ряда сводится к сопоставлению эмпирического и теоретического распределений и определению различий между ними.

В статистической практике наиболее широко используют следующие теоретические распределения:

биномиальное распределение – для описания распределения дискретного альтернативного признака. Оно представляет собой распределение вероятности исходов события, которые можно оценить как положительные или отрицательные;

распределение Пуассона – для изучения маловероятных событий в большой серии независимых испытаний (объем совокупностей N ≥ 100, доля единиц, обладающих данным признаком d → 0). Распределение Пуассона обычно применяется в статистическом контроле качества в массовом производстве. Например, при изучении количества бракованных деталей в массовом производстве, числа отказов автоматических линий и т.п.;

распределение Максвелла применяется при исследовании признака, для которого заранее известно, что распределение имеет положительную асимметрию. Чаще всего распределение Максвелла используется при описании технологических характеристик производственных процессов;

распределение Стьюдента применяют для описания распределения ошибок в малых выборках (n x – средняя арифметическая ряда;
σ 2 – дисперсия значений изучаемого признака;
σ – среднее квадратическое отклонение изучаемого признака;
π = 3,1415 – постоянное число (отношение длины окружности к ее диаметру);
е = 2,7182 – основание натурального логарифма.

Для конкретного распределения среднее значение признака x и среднее квадратическое отклонение σ являются постоянными величинами.

Графически нормальное распределение может быть представлено в виде симметричной колоколообразной кривой, показанной на рис. 5.5.

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

К основным свойствам кривой нормального распределения относятся:

Этот вывод называется правилом «трех сигм», в соответствии с которым можно считать, что все возможные значения нормально распределенного признака укладываются в интервал x +/- 3σ.

Пользоваться функцией нормального распределения в ее первоначальном виде сложно, так как для каждой пары значений x и σ необходимо создавать свои таблицы значений. Поэтому функцию стандартизируют и затем используют для обработки рядов распределения, для чего вводится понятие стандартного отклонения ti:

Тогда относительная плотность нормального распределения рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Выражение в скобках состоит из констант, не содержит параметров и называется стандартизированной функцией нормального распределения. Для нее разработаны специальные таблицы, позволяющие находить конкретные значения φ(t)

при различных значениях аргумента ti. Исходная функция нормального распределения связана со стандартизированной соотношением: φ(x) = φ(t) / σ.

Для получения частот теоретического распределения fi т необходимо иметь в виду, что относительная плотность распределения φ(х) связана с одной стороны с частотой fi, а с другой – со стандартизированной функцией нормального распределения φ(t).

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где fi т – частота теоретического распределения;
hi – ширина интервала;
N – объем статистической совокупности;
σ – среднее квадратическое отклонение;
φ(t) – стандартизованная функция нормального распределения.

Полученные значения fi т округляют до целых значений в соответствии со смыслом характеристики частоты.

Для определения подобия эмпирического и теоретического распределения, можно построить эмпирическую и теоретическую кривые распределения. Их сопоставление позволяет оценить степень близости и расхождения между ними. Визуальное сопоставление эмпирической и теоретической кривых распределения позволяет получить субъективную оценку их близости.

Для получения объективной оценки близости между эмпирической и теоретической кривыми распределения используются специальные статистические показатели – критерии согласия.

Эмпирическое распределение отличается от теоретического тем, что на значения признака в нем влияют случайные факторы. С увеличением объема статистической совокупности влияние случайных факторов ослабевает, и эмпирическое распределение все менее отличается от теоретического.

Критерии согласия основаны на использовании различных мер расстояний между эмпирическим и теоретическим распределением.

Наиболее часто на практике используются следующие критерии согласия:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где fi и fi т – соответственно, частота эмпирического (фактического) и теоретического распределения; n – количество групп, на которые разбита вся совокупность.

Критерий Пирсона можно использовать при соблюдении таких условий:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где χр 2 – расчетная величина «хи-квадрат»-критерия; n – количество групп, на которые разбита вся совокупность.

Эмпирическое и теоретическое распределение признаются близкими друг другу, если С x =13400 руб., а среднее квадратическое отклонение σ = 2200 руб. Объем исследуемой совокупности N = 400 чел., а ширина интервала hi – 2000 руб.

Для расчета критериев согласия построим таблицу 5.17.

Факт соответствия распределения работников предприятия по уровню их заработной платы нормальному распределению подтверждает то, что сумма частот эмпирического распределения почти равна сумме частот теоретического распределения: Σfi = 400 чел. и Σfi т = 398 чел.

В соответствии с формулой 5.33 расчетное значение «хи-квадрат»-критерия: χр 2 = 8,77.

Для подтверждения оценки близости фактического распределения работников предприятия по уровню заработной платы к нормальному, воспользуемся критерием согласия Романовского, который рассчитывается на основе χ 2 – критерия.

По формуле 5.34 значение критерия согласия Романовского: 2,36.

Так как 2,36 Извлечения из таблицы вероятностей для «лямбда»-критерия согласия

λР(λ)0,310,40,9970,50,9640,550,9230,60,8640,650,7920,70,7110,750,6270,80,5440,850,4650,90,3930,950,32710,271,050,221,10,1781,150,1421,20,1121,250,0881,30,0681,350,0521,40,04

Таким образом, утверждать, что отклонения эмпирических частот от теоретических в рассматриваемом примере являются случайными и что в основе фактического распределения рабочих по уровню заработной платы лежит закон нормального распределения, можно только с вероятностью 46,5%. Расхождения между эмпирическим и теоретическим распределением работников предприятия по уровню заработной платы оказались весьма существенны. Однако значение критерия согласия Романовского дает основание считать, что фактическое распределение работников предприятия по уровню заработной платы близко к нормальному.

Показатели формы распределения

При сравнении эмпирического распределения с нормальным важно констатировать не только согласие этих распределений, но и характер их расхождения. Этому служат показатели формы распределения: показатели асимметрии и эксцесса распределения.

Как отмечалось, нормальное распределение характеризуется симметричностью по отношению к точке, соответствующей значению средней арифметической. Ее вершина находится точно в середине кривой. Поэтому сравнение эмпирического распределения с нормальным, прежде всего, констатирует отсутствие или наличие в нем асимметрии распределения. Асимметричные распределения встречаются чаще, чем симметричные. В асимметричном распределении вершины кривой находятся не в середине, а сдвинуты либо влево, либо вправо. Если вершина сдвинута влево, и, следовательно, правая часть кривой оказывается длиннее левой, то такая асимметрия называется правосторонней. Левосторонней будет асимметрия, когда левая часть кривой длиннее правой, и вершина сдвинута вправо.

Для характеристики асимметрии используют коэффициенты асимметрии.

Коэффициент асимметрии Пирсона (AsП) рассчитывается по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

В симметричных распределениях AsП = 0.

При AsП > 0 наблюдается правостороння асимметрия.

При AsП x > Ме > Мо. При левосторонней асимметрии выполняется неравенство x 0,5, то асимметрия значительна.

Коэффициент асимметрии Пирсона характеризует асимметрию только в центральной части ряда распределения, поэтому более распространенным и более точным для характеристики ассиметрии распределения является коэффициент асимметрии (As), рассчитанный на основе центрального момента третьего порядка по формуле:

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

где μ3 – центральный момент третьего порядка, рассчитываемый по формуле 5.43 (табл. 5.18); σ 3 – среднее квадратическое отклонение в третьей степени.

Центральным моментом в статистике называется среднее отклонение индивидуальных значений признака от его среднеарифметической величины. Средние значения разных степеней отклонений индивидуальных значений признака от его средней арифметической величины получили название центральных моментов распределения порядка, соответствующего степени, в которую возводятся отклонения. Формулы для расчета центральных моментов первого, второго, третьего и четвертого порядка по несгруппированным и сгруппированным данным, приведены в таблице 5.19.

вариационный ряд это ряд распределения построенный по какому признаку. Смотреть фото вариационный ряд это ряд распределения построенный по какому признаку. Смотреть картинку вариационный ряд это ряд распределения построенный по какому признаку. Картинка про вариационный ряд это ряд распределения построенный по какому признаку. Фото вариационный ряд это ряд распределения построенный по какому признаку

Величина центрального момента третьего порядка (μ3) зависит, как и его знак, от преобладания положительных кубов отклонений над отрицательными кубами и наоборот.

Если в вариационном ряду преобладают варианты, которые больше, чем средняя величина, то Аs > 0, т.е. имеет место правостороння асимметрия.

Если в вариационном ряду преобладают варианты, которые меньше, чем средняя величина, то Аs 4 – среднее квадратическое отклонение в четвертой степени.

Именно отношение μ4 / σ 4 характеризует крутизну (заостренность) графика распределения. Для нормального распределения μ4 / σ 4 = 3, а Ех = 0.

Наличие положительного эксцесса (Ех > 0) означает, что в изучаемой массе явлений существует слабо варьирующее по данному признаку «ядро», окруженное рассеянным «гало», т.е. распределение относится к островершинным, что свидетельствует о концентрации значений признака в центральной группе. При существенном отрицательном эксцессе (Ех Ех ≥ 3, то эксцесс, т.е. отклонение эмпирического распределения от нормального теоретического распределения по вертикали (выше или ниже его вершины), является существенным.

Пример расчета показателей формы распределения

По данным таблицы 4.13 необходимо охарактеризовать форму распределения работников предприятия по уровню их заработной платы, рассчитав коэффициенты асимметрии и эксцесс распределения и построив полигон распределения работников предприятия по уровню их заработной платы.

Значения показателей, характеризующих структуру ряда распределения работников предприятия по уровню заработной платы и ее вариацию, были рассчитаны ранее в соответствующих примерах: X = 13400 руб.; Ме = 13250 руб.; Мо = 13066,67 руб.; σ = 2200 руб.

Так как при сравнении между собой значений средней заработной платы, медианы и моды выполняется неравенство x > Ме > Мо (13400 > 13250 > 13066,67), то ряд распределения работников предприятия по заработной плате является правосторонне асимметричным. Для подтверждения этих выводов найдем коэффициенты асимметрии.

По формуле 5.36 коэффициент асимметрии Пирсона: AsП = 0,15.

As x ) и σ представим в тысячах рублей.

По формуле 5.43 центральный момент третьего порядка: 2,928.

По формуле 5.37 коэффициент асимметрии: 0,27.

Для оценки существенности коэффициента асимметрии, рассчитанного на основе μ3, по формуле 5.46 рассчитаем среднюю квадратическую ошибку коэффициента асимметрии: 0,12.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *