Ряды распределения. Классификация рядов распределения. Вариационный ряд

Сводка и группировка статистических данных

Ряды распределения. Классификация рядов распределения. Вариационный ряд

Результаты группировки собранных статистических данных, как правило, представляются в виде рядов распределения. Ряд распределения – это упорядоченное распределение единиц совокупности на группы по изучаемому признаку.

Ряды распределения делятся на атрибутивные и вариационные, в зависимости от признака, положенного в основу группировки. Если признак качественный, то ряд распределения называется атрибутивным. Примером атрибутивного ряда является распределение предприятий и организаций по формам собственности (см. табл. 3.1).

Если признак, по которому строится ряд распределения, количественный, то ряд называется вариационным.

Вариационный ряд распределения всегда состоит из двух частей: вариант и соответствующих им частот (или частостей).

Вариантой называется значение, которое может принимать признак у единиц совокупности, частотой – количество единиц наблюдения, обладающих данным значением признака. Сумма частот всегда равна объему совокупности.

Иногда вместо частот рассчитывают частости – это частоты, выраженные либо в долях единицы (тогда сумма всех частостей равна 1), либо в процентах к объему совокупности (сумма частостей будет равна 100%).

Вариационные ряды бывают дискретными и интервальными. У дискретных рядов (табл. 3.7) варианты выражены конкретными числами, чаще всего целыми.
Таблица 3.8. Распределение работников по времени работы в страховой компании

Время работы в компании, полных лет (варианты)Число работающихЧеловек (частоты)в % к итогу (частости)
до года1511,6
11713,2
21914,7
32620,2
4107,8
51813,9
62418,6
Итого129100,0

В интервальных рядах (см. табл. 3.2) значения показателя задаются в виде интервалов. Интервалы имеют две границы: нижнюю и верхнюю. Интервалы могут быть открытыми и закрытыми. У открытых нет одной из границ, так, в табл. 3.

2 у первого интервала нет нижней границы, а у последнего – верхней. При построении интервального ряда в зависимости от характера разброса значений признака используют как равные интервальные промежутки, так и неравные (в табл. 3.

2 представлен вариационный ряд с равными интервалами).

Если признак принимает ограниченное число значений, обычно не больше 10, строят дискретные ряды распределения.

Если вариант больше, то дискретный ряд теряет свою наглядность; в этом случае целесообразно использовать интервальную форму вариационного ряда.

При непрерывной вариации признака, когда его значения в определенных пределах отличаются друг от друга на сколь угодно малую величину, также строят интервальный ряд распределения.

Рассмотрим методику построения дискретных вариационных рядов на примере.

Пример 3.2. Имеются следующие данные о количественном составе 60 семей:

Таблица 3.9.

2 3 3 1 4 2 3 3 1 5 2 4 3 2 2 1 2 3 4 5
2 2 1 3 4 3 3 3 6 6 3 3 6 1 3 4 3 4 4 5
3 3 2 2 1 3 2 5 5 2 4 3 6 1 2 2 3 1 3 4

Для того чтобы получить представление о распределении семей по числу их членов, следует построить вариационный ряд. Поскольку признак принимает ограниченное число целых значений строим дискретный вариационный ряд. Для этого сначала рекомендуется выписать все значения признака (число членов в семье) в порядке возрастания (т.е. провести ранжирование статистических данных):

Таблица 3.10.

1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
3 3 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 6 6 6

Затем необходимо подсчитать число семей, имеющих одинаковый состав. Число членов семей (значение варьирующего признака) – это варианты (будем их обозначать через х), число семей, имеющих одинаковый состав, – это частоты (будем их обозначать через f ). Результаты группировки представим в виде следующего дискретного вариационного ряда распределения:

Таблица 3.11.

Число членов семьи (х)Число семей (y)
18
214
320
49
55
64
Итого60

Покажем методику построения интервальных вариационных рядов распределения на следующем примере.

Пример 3.3. В результате статистического наблюдения получены следующие данные о средней величине процентной ставки 50 коммерческих банков (%):

Таблица 3.12.

14,719,024,520,812,324,617,014,219,718,8
18,120,521,020,720,414,725,122,719,019,6
19,018,917,420,013,825,613,019,018,721,1
13,320,715,219,921,916,016,915,321,420,4
12,820,814,318,015,123,818,514,414,421,0

Как видим, просматривать такой массив данных крайне неудобно, кроме того, не видно закономерностей изменения показателя. Построим интервальный ряд распределения.

  1. Определим число интервалов.

    Число интервалов на практике часто задается самим исследователем исходя из задач каждого конкретного наблюдения. Вместе с тем его можно вычислить и математически по формуле Стерджесса

    n = 1 + 3,322lgN,

    где n – число интервалов;

    N – объем совокупности (число единиц наблюдения).

    Для нашего примера получим: n = 1 + 3,322lgN = 1 + 3,322lg50 = 6,6 ” 7.

  2. Определим величину интервалов (i) по формуле

    где хmax – максимальное значение признака;

    хmin – минимальное значение признака.

    Для нашего примера

    Интервалы вариационного ряда наглядны, если их границы имеют “круглые” значения, поэтому округлим величину интервала 1,9 до 2, а минимальное значение признака 12,3 до 12,0.

  3. Определим границы интервалов.

    Интервалы, как правило, записывают таким образом, чтобы верхняя граница одного интервала являлась одновременно нижней границей следующего интервала. Так, для нашего примера получим: 12,0-14,0; 14,0-16,0; 16,0-18,0; 18,0-20,0; 20,0-22,0; 22,0-24,0; 24,0-26,0.

    Подобная запись означает, что признак непрерывный.

    Если же варианты признака принимают строго определенные значения, например, только целые, но их количество слишком велико для построения дискретного ряда, то можно создать интервальный ряд, где нижняя граница интервала не будет совпадать с верхней границей следующего интервала (это будет означать, что признак дискретный). Например, в распределении работников предприятия по возрасту можно создать следующие интервальные группы лет: 18-25, 26-33, 34-41, 42-49, 50-57, 58-65, 66 и более.

    Кроме того, в нашем примере мы могли бы сделать первый и последний интервалы открытыми, т.д. записать: до 14,0; 24,0 и выше.

  4. По исходным данным построим ранжированный ряд. Для этого запишем в порядке возрастания значения, которые принимает признак. Результаты представим в таблице:
    Таблица 3.13. Ранжированный ряд величин процентной ставки коммерческих банков

    Ставка банка % (варианты)
    12,317,019,923,8
    12,817,420,024,5
    13,018,020,024,6
    13,318,120,425,1
    13,818,520,425,6
    14,218,720,5
    14,318,820,7
    14,418,920,7
    14,719,020,8
    14,719,021,0
    15,119,021,0
    15,219,021,1
    15,319,021,4
    16,019,621,9
    16,919,722,7
  5. Подсчитаем частоты.

    При подсчете частот может возникнуть ситуация, когда значение признака попадет на границу какого-либо интервала. В таком случае можно руководствоваться правилом: данная единица приписывается к тому интервалу, для которого ее значение является верхней границей. Так, значение 16,0 в нашем примере будет относиться ко второму интервалу.

Результаты группировки, полученные в нашем примере, оформим в таблице.

Таблица 3.14. Распределение коммерческих банков по величине кредитной ставки

Краткая ставка, %Количество банков, ед. (частоты)Накопленные частоты
12,0-14,055
14,0-16,0914
16,0-18,0418
18,0-20,01533
20,0-22,01144
22,0-24,0246
24,0-26,0450
Итого50

В последней графе таблицы представлены накопленные частоты, которые получают путем последовательного суммирования частот, начиная с первой (например, для первого интервала – 5, для второго интервала 5 + 9 = 14, для третьего интервала 5 + 9 + 4 = 18 и т.д. ). Накопленная частота, например, 33, показывает, что у 33 банков кредитная ставка не превышает 20% (верхняя граница соответствующего интервала).

В процессе группировки данных при построении вариационных рядов иногда используются неравные интервалы.

Это относится к тем случаям, когда значения признака подчиняются правилу арифметической или геометрической прогрессии или когда применение формулы Стерджесса приводит к появлению “пустых” интервальных групп, не содержащих ни одной единицы наблюдения.

Тогда границы интервалов задаются произвольно самим исследователем исходя из здравого смысла и целей обследования либо по формулам. Так, для данных, изменяющихся в арифметической прогрессии, величина интервалов вычисляется следующим образом:

ik = ik – 1 + c,

где ik – величина вычисляемого интервала;

ik – 1 – величина предыдущего интервала;

с – константа, на которую происходит увеличение длин интервалов.

Порядок расчетов границ неравных интервалов для данных, изменяющихся приблизительно в арифметической прогрессии, показан в табл. 3.15.

Таблица 3.15. Схема интервального вариационного рядас неравными интервалами для данных,подчиняющихся правилу арифметической прогрессии

Номер интервалаГраницы интервалаРасчет величины интервала
10-100100 (величина первого интервала задается исследователем
2100-350100 + 150 = 250 (с = 150 – задается исследователем)
3350-750250 + 150 =400
4750-1300400 + 150 = 550
51 300-2 000550 + 150 = 700
62 000-2 850700 + 150 =850

Для показателей, приблизительно изменяющихся в геометрической прогрессии, величину интервалов можно вычислить по формуле

ik = ik – 1 · c

где ik – величина вычисляемого интервала;

ik – 1 – величина предыдущего интервала;

с – константа-множитель геометрической прогрессии.

Для графического изображения дискретного вариационного ряда используется полигон распределения: на оси абсцисс откладывают значения вариант, а на оси ординат – соответствующие им частоты или частости, полученные точки соединяют отрезками (образуется ломаная линия). По данным табл. 3.7 построим полигон распределения (рис. 3.1).

Рис. 3.1. Полигон распределения

Для графического изображения интервального ряда используют гистограмму, имеющую вид многоступенчатой фигуры, состоящей из прямоугольников. По оси абсцисс откладывают значения границ интервалов. Сами интервалы будут являться основаниями прямоугольников. Высота прямоугольников соответствует частоте или частости интервалов, которые откладываются по оси ординат.

По данным таблицы, приведенной в примере 3.3, построим гистограмму (рис. 3.2).

При неравных интервалах у гистограммы распределения высотами прямоугольников будут являться показатели плотности распределения, рассчитываемые как частное от деления частоты интервала на его величину.

Зависимость между значениями признака и накопленными частотами показывают особые графики, называемые кумулятой и огивой распределения.

Если ряд дискретный, то по оси абсцисс откладывают значения вариант ряда, а по оси ординат – рассчитанные накопленные частоты, получаемые для каждой конкретной варианты как сумма всех предыдущих частот.

Полученные точки соединяют ломаной линией.

Вместо значений накопленных частот можно взять значения накопленных частостей, тогда верхняя точка на кумулятивной кривой по оси ординат будет соответствовать значению 100%.

Рис. 3.2. Гистограмма распределенияВ случае интервального ряда при построении кумуляты по оси абсцисс отмечают границы интервальных групп, накопленные частоты по оси ординат относят к верхним границам интервалов.

По данным таблицы, приведенной в примере 3.3, построим кумуляту распределения для интервального ряда (рис. 3.2).

Рис. 3.3. Кумулята распределения

Если у кумулятивной кривой поменять местами ось абсцисс с осью ординат, получим график, называемый огивой распределения (рис. 3.4).

Рис. 3.4. Огива распределения

Источник: https://www.intuit.ru/studies/courses/3595/837/lecture/31352?page=3

Вариационные ряды — помощь в оценке распределения явлений по величине признаков

Ряды распределения. Классификация рядов распределения. Вариационный ряд

Вариационный ряд (frequency table)- ранжированный ряд распределения по величине какого-либо признака. Этот признак носит название варьирующего, а его отдельные числовые значения называются вариантами и обозначаются через «х». Число, показывающее, сколько раз данная варианта встречается в вариационном ряду, называется частотой и обозначается через «р».

Вариационный ряд можно разбивать на отдельные (по возможности равные) части, которые называются квантилями (quantile). Наиболее часто употребляемые квантили представлены в таблице:

Рис. 1 Этапы описания (обобщения) количественного признака

Виды вариационных рядов

Вариационные ряды могут быть следующих видов:

  1. В зависимости от вида случайной величины :

— дискретный;

— непрерывный .

  1. В зависимости от группировки вариант:

— несгруппированный;

— сгруппированный (интервальный):

  1. В зависимости от частоты, с которой каждая варианта встречается в вариационном ряду:
    • простой ( р =1);
    • взвешенный ( р >1).

Графическое изображение вариационных рядов

где  х — варианты, р — частоты.

Основные характеристики вариационного ряда

Такие характеристики зависят от оцениваемых показателей:

1). Показатели, характеризующие центральную тенденцию (central tendency) или уровень ряда: средние величины или меры расположения (собственно средние и структурные средние).

2). Показатели, характеризующие разнообразие (рассеяние, вариацию, разброс) (spread) признака: стандартное отклонение, дисперсия, размах, интерквартильный интервал.

Выбор характеристик центральной тенденции и разнообразия признака прежде всего зависит от вида распределения. В случае нормального распределения используют показатели параметрической статистики, в случае распределения, отличного от нормального и при неизвестном виде распределения применяют показатели непараметрической статистики.

Средние величины

Средняя величина — обобщающий коэффициент, который характеризует наиболее типичный размер определенного признака в целом для совокупно­сти или для отдельных ее частей. Расчет средних величин имеет смысл только для качественно однородной совокупности, в связи с этим в одной совокупности может быть столько средних, на сколько однородных групп она может быть разбита.

Виды средних величин

Средняя арифметическая(mean) — применяется, если варианты возрастают (убывают) в арифметической прогрессии.

х — средняя арифметическая;

xi — варианта;

р — частота встречаемости варианты;

n — число наблюдений

Свойства средней арифметической:

— носит обобщающий характер;

— имеет абстрактное значение;

— алгебраическая сумма отклонений отдельных вариант от средней равна 0 (сущность средней и способ проверки правильности расчета средней);

— сумма квадратов отклонений отдельных вариант от средней меньше суммы квадратов отклонений вариант от любой другой величины, неравной средней;

— сумма произведений отдельных вариант на свои частоты равна произведению средней на число наблюдений (единство суммарного действия и способ провер­ки правильности расчета средней);

— если каждую из вариант увеличить или уменьшить на определенное число (в определенное число раз) ,то средняя арифметическая увеличится или уменьшится на столько же (во столько же);

— если частоту всех вариант пропорционально изменить, то средняя арифметическая от этого не изменится.

Средняя геометрическая — вычисляется, если варианты возрастают (убыва­ют) в геометрической прогрессии.

На практике используют логарифмированную формулу:

Структурные средние

Мода (Мо) (mode)- наиболее часто встречающаяся в вариационном ряду   варианта.

Мода используется:

  • при малом числе наблюдений, когда велико влияние состава совокупностина среднюю ;
  • для характеристики центральной тенденции при ассиметричных распределениях, когда велико влияние на среднюю крайних вариант;

Медиана (Me)(median) — варианта, которая делит вариационный ряд на две равные

части. Медиана используется:

  • при необходимости знать, какая часть вариант лежит выше и ниже

средин­ного значения ;

  • для характеристики центральной тенденции при ассиметричных распределениях

Характеристики разнообразия вариационного ряда

  1. Размах вариации (амплитуда) (range): А = Хmах — Xmin
  2. Стандартное отклонение (среднее квадратическое отклонение) (standard deviation, SD)

— приблизительный расчет стандартного отклонения по амплитуде:

где К — коэффициент Ермолаева, рассчитывается по специальной таблице с учетом числа наблюдений (см. приложение).

При числе наблюдений больше 30:

Стандартное отклонение наиболее часто используется при определении нормы и патологии, в основе которого лежит «правило трех сигм», справедливое только для нормального распределения.

Сводная таблица формул

для нахождения средних значений и мер рассеяния

Примечание: не стоит путать пары обозначений и , а также   и s (SD) между собой. Они обозначают схожие вещи, но в разных совокупностях (мю и сигма относятся к генеральной совокупности, выборочная средняя и стандартное отклонение к выборочной средней). Подробнее в главе «Выборочный метод».

 «Правило трех сигм»

68.3 % всех вариант отклоняются от своей средней не более, чем на s

95.4% вариант находятся в пределах X ± 2s

99.7% вариант находятся в пределах X ± 3s

Отклонение параметра от его средней арифметической в пределах  s расценивается как норма, субнормальным считается отклонение в пределах  ± 2s и патологическим — сверх этого предела, т.е. > ± 2s» (рис. )

Рис.3  Правило «трех сигм» ( SD – стандартное отклонение).

  1. Дисперсия (варианса) (variance)

При распределении Пуассона дисперсия равна средней:  

  1. Коэффициент вариации (variation coefficient):

Вариационный ряд считается однородным при Cv 15% .

Коэффициент вариации используется при сравнении вариационных рядов, имеющих различную размерность, или одной размерности, но обладающими резкими различиями в своих значениях, затрудняющими их сопоставление.

  1. Интерквартильный интервал (inter-quartile range, IQR)

Вариационный ряд разбивают на четыре интервала, получая, соответственно, 25%, 50% и 75% квантили; 25% и 75% квантили называют также нижним (low quartile) и верхним квартилями(high quartile). 50% квантиль – это медиана. Внутри интерквартильного интервала  (между 25% и 75% квантилями) лежат 50% наиболее типичных (близких к центральному) значений.

Таким образом, в случае нормального распределения вариационный ряд описывается средней величиной и стандартным отклонением, если распределение неизвестно или оно отлично от нормального, центральную тенденцию и разброс можно описать с помощью медианы, нижнего и верхнего квартиля (интерквартильным интервалом).

Рис.4   Графическое представление описательной статистики (коробчатый график, «коробка с усами», box-plot)

Проверка нормальности распределения

Соответствие экспериментального распределения нормальному проверяется следующими способами:
  1. По числам Вестергарда при нормальном распределении в пределах:

х ± 0.3 s находится 25 % всех единиц наблюдения;

х ± 0.7 s находится 50 % всех единиц наблюдения;

х ± l,l s находится 75 % всех единиц наблюдения;

х ± 3,0 s находится 99 % всех единиц наблюдения.

  1. По соотношению средней арифметической и структурных средних:

— при нормальном распределении, которое обладает симметричностью:

или

— правило «двух третей» Юла:

а). если распределение симметрично: Me = Mo;

б). если распределение обладает правосторонней асимметрией: Me > Mo;

в). если распределение имеет левостороннюю асимметрией Me < Mo

  1. По коэффициенту асимметрии (skewness):

а) если распределение симметрично: A s = 0

б) при правосторонней асимметрии:  A s > 0

в) при левосторонней асимметрии: A s < 0

Рис. 5  Графическое изображение симметричного и асимметричного распределений

  1. По показателю эксцесса или показателю островершинности (kurtosis) мера остроты пика распределения случайной величины. Показатель эксцесса нормального распределения составляет 3. Стоит запомнить, что помимо возможной асимметрии вариационного ряда, также стоит оценивать высоту колоколообразной кривой, так как не все симметричные вокруг средней гистограммы вариационного ряда можно считать нормально распределенными.

Вершина более крутая, чем для нормального распределения: эксцесс положительный, имеются длинные хвосты распределения;
Вершина более пологая, чем у нормального распределения: эксцесс отрицательный, имеются короткие хвосты распределения.

  1. Если Ме занимает срединное положение между 25-м и 75-м процентилем, то распределение близко к нормальному.

Так как значительная часть статистических методов (параметрическая статистика) основана на предположении, что распределение близко к нормальному, то, если экспериментальные данные не ложатся на кривую нормального распределения, их пытаются преобразовать таким образом, чтобы полученная кривая соответствовала нормальному распределению. Наиболее часто используются следующие способы «нормализующего преобразования» (transformation to normality) данных:

  • гармоническое преобразование: 1 /х;
  • извлечение квадратного корня: 
  • логарифмирование {дает наиболее точное приближение}: log xiУспешность преобразования данных оценивают по коэффициенту асимметрии: чем ближе он к 0, тем ближе экспериментальное распределение к нормальному.
  • Шапиро-Вилка (Shapiro-Wilk)
  • Колмогорова-Смирнова (Kolmogorov-Smirnov)
  • Крамера-вон Майса (Kramer-von Mises)
  • Андерсона-Дарлинга (Anderson-Darling)

Исключение «выскакивающих» вариант

Иногда в небольших совокупностях встречаются варианты резко отличающи­еся по своему значению от других, так называемая «выскакивающая» варианта (outlying case).

Если данное отличие обусловлено случайными колебаниями изучаемой величины, то такие варианты оставляют в совокупности и включают в общее число наблюдений.

Если отличие обусловлено ошибками в исследовании или его причину точно нельзя установить, то «выскакивающие» вари­анты необходимо исключить из исследования.

Методика исключения вариант:

1)рассчитываются средняя величина и стандартное отклонение без учета «выскакивающих» вариант;

2)анализируется соотношение:

— если Хвыск — х, > s × f, то «выскакивающая» варианта исключается из  исследования;

  • если хвыск — х < s × f то «выскакивающая» варианта должна быть включена в исследование.

При этом f – коэффициент Романовского, который определяется по специальной таблице с учетом числа наблюдений и вероятностью исключения варианты.

Whirlpool4396841 Filters uses state of the art technology to help remove Chlorine, Lead, Mercury, Cadmium, and Thallium.
SAME GREAT QUALITY AT A FRACTION OF THE PRICE — Experience the same quality of filtration without any sacrifice to the water flow rate.

Whirlpool 4396841 Water Filter is also nearly half the cost as the manufacturer’s primary filter.
CHANGE YOUR FILTER EVERY 6 MONTHS — For optimum performance it’s recommended you change your filter every 6 months.

Included with your purchase is a set of reminder stickers to help alert you when it’s time to change.

Мы уверенны, что с помощью нашей статьи читатели почерпнули для себя всю необходимую информацию о таком понятии, как вариационные ряды, средние величины. Наши авторы постарались максимально широко осветить необходимость данных видов исследования, их последовательность и результаты, которые при освоении методикой можно получить.

Благодарим за интерес, проявленный к нашей статье. Оставайтесь с нами!

Если Вам понравилась статья и оказалась полезной, Вы можете поделиться ею с коллегами и друзьями в социальных сетях:

Источник: https://lit-review.ru/biostatistika/variacionnye-ryady-4588-2/

Ряды распределения. Классификация рядов распределения

Ряды распределения. Классификация рядов распределения. Вариационный ряд

Статистические ряды распределения представляют собой простейший вид группировки.

Статистический ряд распределения — это упорядоченное количественное распределение единиц совокупности на однородные группы по варьирующему (атрибутивному или количественному) признаку.

В зависимости от признака, положенного в основу образования групп, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, т.е. признакам, не имеющим числового выражения. Примером атрибутивного ряда распределения является распределение экономически активного населения РФ по полу в 2010 г. (табл. 3.10).

Таблица 3.10. Распределение экономически активного населения РФ по полу в 2010 г.

ПолЧисленность экономически активного населения, млн человекУдельный вес численности экономически активного населения, % к итогу
Женский17049
Мужской51
Итого75,5100

Вариационными называются ряды распределения, построенные по количественному признаку, т.е. признаку, имеющему числовое выражение.

Вариационный ряд распределения состоит из двух элементов: вариантов и частот.

Вариантами называют отдельные значения признака, которые он принимает в вариационном ряду.

Частотами являются численности отдельных вариантов или каждой группы вариационного ряда. Частоты показывают, как часто встречаются те или иные значения признака в изучаемой совокупности. Сумма всех частот определяет численность всей совокупности, ее объем.

Частостями называют частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1, или 100%.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды распределения.

Дискретный вариационный ряд распределения — это ряд распределения, в котором группы составлены по признаку, изменяющемуся прерывно, т.е. через определенное число единиц, и принимающему только целые значения. Например, распределение числа построенных квартир в Российской Федерации по числу комнат в них I! 2010 г. (табл. 3.11).

Таблица 3.11. Распределение числа построенных квартир в Российской Федерации по числу комнат в них в 2010 г.

Число комнатЧисло построенных квартир, тыс.Удельный вес квартир, % к итогу
123233,0
221831,1
316122.9
49113,0
Итого702100,0

Интервальный вариационный ряд распределения — это ряд распределения, в котором группировочный признак, составляющий основание группировки, может принимать в интервале любые значения, отличающиеся друг от друга на сколь угодно малую величину.

Построение интервальных вариационных рядов целесообразно прежде всего при непрерывной вариации признака (табл. 3.12), а также если дискретная вариация признака проявляется в широких пределах (табл. 3.13), т.е. число вариантов дискретного признака достаточно велико.

Таблица 3.12. Распределение субъектов Южного федерального округа РФ по площади территории на 1 января 2011 г.

Группа субъектов округа по площади территории, тыс. км2Число субъектовУдельный вес числа субъектов, % к итогу
3,5-40,0616.2
40,0-76,5538,5
76,5 113.0215.3
Итого13100.0

Таблица 3.13. Распределение субъектов Центрального федерального округа РФ по числу муниципальных учреждений образования на 1 января 2011 г.

Группа субъектов по числу муниципальных учреждений образованияЧисло субъектовУдельный вес субъектов, % К ИТОГУ
570-83042.3.5
830-1090317,6
1090-1350847,1
1350 и более311.8
Итого18100,0

Правила построения рядов распределения аналогичны правилам построения группировки.

Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, распределения.

Полигон используют при изображении дискретных вариационных рядов распределения.

Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладывают ранжированные значения варьирующего признака, а по оси ординат наносят шкалу для выражения величины частот.

Полученные на пересечении оси абсцисс (X) и оси ординат (У) точки соединяют прямыми линиями, в результате чего получают ломаную линию, называемую полигоном частот.

Гистограмму применяют для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладывают величины интервалов, а частоты изображают прямоугольниками, построенными на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам.

Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить прямыми линиями.

При построении гистограммы распределения вариационного ряда с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах. Плотность распределения — это частота, рассчитанная на единицу ширины интервала,

т.е. сколько единиц в каждой группе приходится па единицу величины интервала.

Для графического изображения вариационных рядов распределения может использоваться кумулятивная кривая. С помощью кумуляты изображают ряд накопленных частот. Накопленные частоты определяют путем последовательного суммирования частот по группам.

При построении кумуляты интервального вариационного ряда по оси абсцисс (X) откладывают варианты ряда, а по оси ординат (У) накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную линию, т.е. кумуляту.

Если при графическом изображении вариационного ряда распределения в виде кумуляты оси X и У поменять местами, то получается огива.

Источник: https://studme.org/1497050420666/statistika/ryady_raspredeleniya_klassifikatsiya_ryadov_raspredeleniya

Ряды распределения и их виды

Ряды распределения. Классификация рядов распределения. Вариационный ряд

Понятие о статистических рядах. В результате обработки и систематизации первичных статистических материалов получают ряды цифровых показателей, которые характеризуют отдельные стороны изучаемых явлений либо их изменение во времени. Эти ряды называются статистическими.

По своему содержанию статистические ряды делятся на два вида:

  • 1) ряды динамики, с помощью которых можно дать характеристику изменений размеров общественных явлений во времени;
  • 2) ряды распределения, характеризующие, как распределяются единицы совокупности по тому или иному признаку.

Рядом распределения называется упорядоченное распределение единиц совокупности по какому-либо варьирующему признаку. В большинстве случаев построение рядов распределения не имеет самостоятельного значения, а является составной частью операции обработки данных на основе их группировки.

Построение рядов распределения вытекает из принципов статистической группировки. В большинстве случаев ряд распределения — это простейшая группировка по одному признаку, в которой отдельные значения признака или выделенные группы характеризуются одним показателем: числом единиц или удельным весом каждой группы в общем объеме совокупности.

В ряду распределения выделяют два структурных элемента:

  • 1) варианты — различные значения группировочного признака. Их принято обозначать буквой X. Варианты могут характеризоваться словами (например, городское и сельское население) или цифрами (например, группировка рабочих по квалификации: 1, 2, 3, 4, 5, 6 разряды);
  • 2) число единиц в группах или их удельный вес в совокупности. Числа, показывающие, как часто встречается та или иная варианта в ряду распределения, называются частотами. Обозначаются латинской буквой /. Частоты являются всегда положительными числами, так как, показывая, сколько раз встречается варианта, они по своей природе не могут быть менее нуля. Частоты выражаются как в абсолютных величинах — числом единиц совокупности, так и в относительных величинах — в виде долей или в процентах к итогу.

Частоты, выраженные в виде относительных величин, называются частостями и обозначаются буквой d. Сумма частостей всегда равна 1, если они выражены в долях единицы, или 100%, если они выражены в процентах. Как правило, для расчета обобщающих характеристик используют как частоты, так и частости.

Частоты и частости могут быть кумулятивными (накопленными), когда они представлены в виде последовательно накопленных сумм.

Сумма частот ряда распределения называется объемом совокупности и обозначается латинской буквой п.

Пример распределения рабочих по заработной плате представлен в табл. 2.20.

Таблица 2.20

Распределение работников по заработной плате

Заработная плата, руб.(Л)Числорабочих, человек частота (f)Удельный вес рабочих, % частость (d)Накопленные частоты, человек(S)
4 00027,12
5 000517,17
6 000414,311
7 000621,417
8 0001035,727
9 00013,628
ВсегоСОCNII100,0

Особый вид ряда распределения — ранжированный ряд, когда вместо частот или частостей поставлены ранги. Ранг — это число, показывающее порядковый номер варианты признака по возрастанию или убыванию.

Виды рядов распределения. Ряды распределения различаются по виду и характеру вариации признака (рис. 2.4).

  • 1. По виду признака ряды распределения могут быть атрибутивными и вариационными. Атрибутивные ряды — это ряды, в которых признак выражен определенным термином, фиксирующим свойство или качество предмета или явления. Вариационные ряды — это ряды, в которых варианты признака выражены цифрами.
  • 2. В зависимости от характера вариации различают дискретные и интервальные вариационные ряды.

Дискретные вариационные ряды — это ряды, в которых признак выражается в виде определенного числа, взятого с заданной степенью точности. Интервальные вариационные ряды — это ряды, в которых

Рис. 2.4. Виды статистических рядов

варианты заданы в виде интервалов. Интервальные вариационные ряды объединяют варианты непрерывных признаков или имеющихся в широких пределах дискретных признаков.

Графически вариационный ряд можно изобразить, как и любой ряд значений аргумента и функции, используя прямоугольную систему координат. Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма распределения.

Графическое изображение дискретного вариационного ряда строится в виде полигона распределения, представляющего собой распределение по признаку X.

Для его построения по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат — величины частот (или частостей) (рис. 2.5).

Иногда для замыкания полигона крайние точки соединяют с точками на оси абсцисс и получают многоугольник.

Графическое изображение интервального вариационного ряда строится в виде гистограммы распределения.

При ее построении для вариационного ряда с равными интервалами на оси абсцисс откладываются границы интервалов и, используя отрезки, представляющие интервалы, как основания, строят на них прямоугольники с высотой, равной частоте данного интервала.

В результате получается распределение, изображенное в виде смежных друг с другом столбиков. Гистограмма распределения рабочих по размеру месячной заработной платы представлена на рис. 2.6.

Рис. 2.5. Полигон распределения квартир дома по числу живущих в них лиц

Рис. 2.6. Гистограмма распределения для вариационного ряда с равными

интервалами

Для интервальных рядов с неравными интервалами строят гистограмму плотностей распределения, так как в ряде с неравными интервалами именно плотность распределения дает представление о заполненности каждого интервала. Плотность распределения определяется по формуле

Площадь прямоугольников гистограммы равна произведению плотности на величину интервала, т.е. частоте. Следовательно, площадь всей гистограммы численно равна сумме частот или численности единиц совокупности.

Рассмотрим распределение населения района города по возрасту (табл. 2.21) и изобразим его графически.

Таблица 2.21

Распределение населения района по возрасту

Возраст, летЧисло лиц, тыс. человекПлотность распределения (расчет)
Менее 1674,74,7 (74,7 : 16)
16-45104,93,6 (104,9:29)
45—6033,32,2 (33,3: 15)
60-10028,50,7 (28,5 : 40)

График распределения населения района по возрасту представлен на рис. 2.7.

Рис. 2.7. Гистограмма распределения для вариационного ряда с неравными интервалами

Любой вариационный ряд можно представить графически в виде кривой накопленных частот как функции признака. На оси абсцисс откладывают варианты или границы интервалов, а на оси ординат — соответствующие накопленные частоты.

Полученные точки соединяют непрерывной линией, которая и является кумулятой. Изображение вариационного ряда в виде кумуляты более эффективно, если частоты выражены в частостях. График кумулятивной кривой представлен на рис.

2.8.

Если при графическом изображении вариационного ряда в виде кумуляты оси поменять местами, то получится огива. Термин «огива» для графика кумулятивной кривой ряда распределения в 1875 г. ввел

Рис. 2.8. Кумулята распределения рабочих по тарифному разряду

Ф. Гальтон. Он положил начало применению графического метода для определения обобщающих статистических характеристик распределения, так как на основе огивы находил медиану и квартили.

Преобразование вариационных рядов. Вариационные ряды можно преобразовывать: дискретный ряд в интервальный и интервальный ряд в дискретный.

Преобразование дискретного ряда в интервальный. Представим дискретный ряд распределения рабочих по заработной плате в виде интервального. Для этого необходимо по формуле 2.1 рассчитать величину интервала: h = (9000 – 4000) : 3 = 1667 руб. (2000 руб.).

Получаем:

Преобразование интервального ряда в дискретный. Для преобразования интервального ряда с закрытыми интервалами в дискретный достаточно заменить интервал его серединой.

Получаем:

Ряды распределения имеют следующее значение:

  • 1) вариационные ряды служат средством свертывания или сжатия многообразной массовой информации в компактную форму, по ним можно составить достаточно определенное суждение о характере вариации, изучить конкретные различия признаков явлений, входящих в исследуемую совокупность;
  • 2) на основе рядов распределения исчисляются особые обобщающие характеристики совокупности (средняя, мода, медиана, дисперсия и т.д.), которые используются для более глубокого анализа социально-экономических явлений и процессов.

Источник: https://bstudy.net/672814/sotsiologiya/ryady_raspredeleniya_vidy

Ряды распределения и их классификация

Ряды распределения. Классификация рядов распределения. Вариационный ряд

Статистические ряды распределения представляют простейший вид группировки, в которой каждая выделенная группа характеризуется одним показателем.

Статистический рад распределения — это упорядоченное количественное распределение единиц совокупности на однородные группы по варьирующему (атрибутивному или количественному) признаку.

В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, т. е. признакам, характеризующим состояние изучаемого явления и не имеющим числового выражения. Примером атрибутивного ряда распределения является распределение студентов 105 группы физ-мата по полу (табл. 3.5).

Таблица 3.5

Пол Число студентов, чел. Удельный вес студентов, в % итогу
Женский Мужской
Итого

Вариационными называются ряды распределения, построенные по количественному признаку, т. е. признаку, имеющему числовое выражение у отдельных единиц совокупности.

Вариационный ряд состоит из двух элементов: вариантов признака и частот.

Частотами называются численности отдельных вариантов или каждой группы вариационного ряда. Частоты показывают, как часто встречаются те или иные значения признака в изучаемой совокупности. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают дискретные и интервальные вариационные ряды.

Дискретный вариационный ряд — это ряд распределения, в котором группы составлены по признаку, изменяющемуся прерывно, т. е. через определенное число единиц, и принимающему только целые значения.

Например, группы студентов по баллу в сессию по изученному предмету (табл. 3.6).

Таблица 3.6

Распределение студентов группы физ-мата-105 по успеваемости в летнюю сессию 2004 г.

Балл в сессию Число студентов, чел. Удельный вес студентов, в % к итогу
17,9 53,6 17,8 10,7
Итого 100,0

Интервальный вариационный ряд распределения — это ряд распределения, в котором группировочный признак, составляющий основание группировки, может принимать в интервале любые значения, отличающиеся друг от друга на сколь угодно малую величину.

Построение интервальных вариационных рядов целесообразно прежде всего при непрерывной вариации признака (табл. 3.7), а также если дискретная вариация признака проявляется в широких пределах (табл.3.8), т. е. число вариантов дискретного признака достаточно велико.

Таблица 3.7

Распределение страховых компаний одного из регионов Российской Федерации по численности работающих на 1 октября 2004 г.

Группы страховых компаний по численности работающих, чел. Число страховых компаний Удельный вес страховых компаний, в % к итогу
100-150 150-200 200-250 250-300 31,25 43,75 18,75 6,25
Итого 100,00

Таблица 3.8

Распределение отправленных телеграмм по числу слов за октябрь 2004г.

Группы телеграмм по числу слов Число телеграмм Удельный вес телеграмм, в % к итогу
До 5 5-10 10-15 15 и более 56,5 27,4 12,9 3,2
Итого 100,0

Правила построения рядов распределения аналогичны правилам построения группировки.

Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения.

Полигон используется при изображении дискретных вариационных рядов.

Для его построения в прямоугольной системе координат по оси абсцисс в одинаковом масштабе откладываются ранжированные значения варьирующего признака, а по оси ординат наносится шкала для выражения величины частот.

Полученные на пересечении оси абсцисс (х) и оси ординат (у) точки соединяются прямыми линиями, в результате чего получают ломаную линию, называемую полигоном частот.

Гистограмма применяется для изображения интервального вариационного ряда. При построении гистограммы на оси абсцисс откладываются величины интервалов, а частоты изображаются прямоугольниками, построенным на соответствующих интервалах. Высота столбиков должна быть пропорциональна частотам.
Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить прямыми линиями.

При построении гистограммы распределения вариационного рядa с неравными интервалами по оси ординат наносят не частоты, а плотность распределения признака в соответствующих интервалах. Плотность распределения — это частота, рассчитанная на единицу ширины интервала, то есть сколько единиц в каждой группе приходится на единицу величины интервала.

Для графического изображения вариационных рядов может использоваться кумулятивная кривая. При помощи кумуляты изображается ряд накопленных частот. Накопленные частоты определяются путем последовательного суммирования частот по группам.

При построении кумуляты интервального вариационного ряда по оси абсцисс (х) откладываются варианты ряда, а по оси ординат (у) накопленные частоты, которые наносят на поле графика в виде перпендикуляров к оси абсцисс в верхних границах интервалов. Затем эти перпендикуляры соединяют и получают ломаную линию, т. е. кумуляту.

Если при графическом изображении вариационного ряда в виде кумуляты оси х и у поменять местами, то получим огиву.

Предыдущая1234567Следующая

Дата добавления: 2015-10-13; просмотров: 1934; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ

ПОСМОТРЕТЬ ЁЩЕ:

Источник: https://helpiks.org/5-68207.html

Поделиться:
Нет комментариев

    Добавить комментарий

    Ваш e-mail не будет опубликован. Все поля обязательны для заполнения.