Главная - Железобетонные лотки
Алгоритм построения интервального вариационного ряда с равными интервалами. Построение интервального ряда распределения

Представляются в виде рядов распределения и оформляются в виде .

Ряд распределния является одним из видов группировок.

Ряд распределения — представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

  • Атрибутивными — называют ряды распределения, построенные по качественными признакам.
  • Ряды распределения, построенные в порядке возрастания или убывания значений количественного признака называются вариационными .
Вариационный ряд распределения состоит из двух столбцов:

В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются . Дискретная варианта — выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд.
Во втором столбце содержится количество конкретных вариант , выраженное через частоты или частости:

Частоты — это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака, которые обозначают . Сумма всех частот равна должна быть равна численности единиц всей совокупности.

Частости () — это частоты выраженные в процентах к итогу. Сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:
  • Полигона
  • Гистограммы
  • Кумуляты
  • Огивы

Полигон

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) — частоты или частости.

Полигон на рис. 6.1 построен по данным микропереписи населения России в 1994 г.

6.1. Распределение домохозяйств по размеру

Условие : Приводятся данные о распределении 25 работников одного из предприятий по тарифным разрядам:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Задача : Построить дискретный вариационный ряд и изобразить его графически в виде полигона распределения.
Решение :
В данном примере вариантами является тарифный разряд работника. Для определения частот необходимо рассчитать число работников, имеющих соответствующий тарифный разряд.

Полигон используется для дискретных вариационных рядов.

Для построения полигона распределения (рис 1) по оси абсцисс (X) откладываем количественные значения варьирующего признака — варианты, а по оси ординат — частоты или частости.

Если значения признака выражены в виде интервалов, то такой ряд называется интервальным.
Интервальные ряды распределения изображают графически в виде гистограммы, кумуляты или огивы.

Статистическая таблица

Условие : Приведены данные о размерах вкладов 20 физических лиц в одном банке (тыс.руб) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Задача : Построить интервальный вариационный ряд с равными интервалами.
Решение :

  1. Исходная совокупность состоит из 20 единиц (N = 20).
  2. По формуле Стерджесса определим необходимое количество используемых групп: n=1+3,322*lg20=5
  3. Вычислим величину равного интервала: i=(152 — 2) /5 = 30 тыс.руб
  4. Расчленим исходную совокупность на 5 групп с величиной интервала в 30 тыс.руб.
  5. Результаты группировки представим в таблице:

При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и нижняя граница другого интервала), то эта величина относится к той группе, где эта величина выступает в роли верхней границы.

Гистограмма

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

На рис. 6.2. изображена гистограмма распределения населения России в 1997 г. по возрастным группам.

Рис. 6.2. Распределение населения России по возрастным группам

Условие : Приводится распределение 30 работников фирмы по размеру месячной заработной платы

Задача : Изобразить интервальный вариационный ряд графически в виде гистограммы и кумуляты.
Решение :

  1. Неизвестная граница открытого (первого) интервала определяется по величине второго интервала: 7000 — 5000 = 2000 руб. С той же величиной находим нижнюю границу первого интервала: 5000 — 2000 = 3000 руб.
  2. Для построения гистограммы в прямоугольной системе координат по оси абсцисс откладываем отрезки, величины которых соответствуют интервалам варицонного ряда.
    Эти отрезки служат нижним основанием, а соответствующая частота (частость) — высотой образуемых прямоугольников.
  3. Построим гистограмму:

Для построения кумуляты необходимо рассчитать накопленные частоты (частости). Они определяются путем последовательного суммирования частот (частостей) предшествующих интервалов и обозначаются S. Накопленные частоты показывают, сколько единиц совокупности имеют значение признака не больше, чем рассматриваемое.

Кумулята

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат — накопленные частоты или частости (рис. 6.3).

Рис. 6.3. Кумулята распределения домохозяйств по размеру

4. Рассчитаем накопленные частоты:
Наколенная частота первого интервала рассчитывается следующим образом: 0 + 4 = 4, для второго: 4 + 12 = 16; для третьего: 4 + 12 + 8 = 24 и т.д.

При построении кумуляты накопленная частота (частость) соответствующего интервала присваивается его верхней границе:

Огива

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака — на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат — накопленные значения доли (в процентах) по объему признака.

Равномерному распределению признака соответствует на графике диагональ квадрата (рис. 6.4). При неравномерном распределении график представляет собой вогнутую кривую в зависимости от уровня концентрации признака.

6.4. Кривая концентрации

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

хорошую работу на сайт">

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ЗАДАЧА 1

Имеются следующие данные о заработной плате работников на предприятии:

Таблица 1.1

Размер заработной платы в усл. ден. ед.

Требуется построить интервальный ряд распределения, по которому найти;

1) среднюю заработную плату;

2) среднее линейное отклонение;

4) среднее квадратическое отклонение;

5) размах вариации;

6) коэффициент осцилляции;

7) линейный коэффициент вариации;

8) простой коэффициент вариации;

10) медиану;

11) коэффициент асимметрии;

12) показатель асимметрии Пирсона;

13) коэффициент эксцесса.

Решение

Как известно, варианты (значения признано) расположены в порядке возрастания образуют дискретный вариационный ряд. При большом числе вариант (больше 10) даже в случае дискретной вариации строятся интервальные ряды.

Если составляется интервальный ряд с ровными интервалами, то размах вариации делится на указанное число интервалов. При этом, если полученное значение целое и однозначное (что бывает редко), то длина интервала принимается равной этому числу. В остальных случаях производится округление обязательно в сторону увеличения, так чтобы последняя оставляемая цифра была чётной. Очевидно, с увеличением длины интервала расширяется размах вариации на величину, равной произведению числа интервалов: на разность расчетной и первоначальной длины интервала

а) Если величина расширения размаха вариации незначительна, то ее либо прибавляют к наибольшему либо вычитают из наименьшего значения признака;

б) Если величина расширения размаха вариации ощутима, то, чтобы не произошло смешения центра размаха, ее примерно делят пополам одновременно прибавляя к наибольшему и вычитая из наименьшего значений признака.

Если составляется интервальный ряд с неравными интервалами, то процесс упрощается, но по-прежнему длина интервалов должна выражаться числом с последней чётной цифрой, что значительно упрощает последующие расчёты числовых характеристик.

30 - объем выборки.

Составим интервальный ряд распределения, используя формулу Стерджеса:

K = 1 + 3.32*lg n,

K - число групп;

K = 1 + 3.32*lg 30 = 5,91=6

Находим размах признака - заработная плата работников на предприятии - (х) по формуле

R= xmaх - xmin и делим на 6; R= 195-112=83

Тогда длина интервала будет l пер=83:6=13.83

Началом первого интервала будет 112. Прибавляя к 112 l рас=13,83, получим его конечное значение 125,83, которое одновременно является началом второго интервала и т.д. конец пятого интервала - 195.

При нахождении частот следует руководствоваться правилом: «если значение признака совпадает с границей внутреннего интервала, то его следует относить к предыдущему интервалу».

Получим интервальный ряд частот и накопительных частот.

Таблица 1.2

Следовательно, 3 работника имеют зар. плату от 112 до 125,83 усл.ден.ед. Наибольшая зар. плата от 181,15 до 195 усл.ден.ед. только у 6-ті работников.

Для расчёта числовых характеристик интервальный ряд преобразуем в дискретный, взяв в качестве вариант середины интервалов:

Таблица 1.3

14131,83

По формуле взвешенного среднего арифметического

усл.ден.ед.

Среднее линейное отклонение:

где xi - значение изучаемого признака у i-той единицы совокупности,

Средняя величина изучаемого признака.

Размещено на http://www.allbest.ru/

LРазмещено на http://www.allbest.ru/

Усл.ден.ед.

Среднее квадратическое отклонение:

Дисперсия:

Относительный размах вариации (коэффициент осцилляции): с= R:,

Относительное линейное отклонение: q = L:

Коэффициент вариации: V = у:

Коэффициент осцилляции показывает относительную колеблемость крайних значений признака около среднего арифметического, а коэффициент вариации характеризует степень и однородности совокупности.

с= R: = 83 / 159,485*100% = 52,043%

Таким образом, разница между крайними значениями на 5,16% (=94,84%-100%) меньше среднего значения заработной платы работников на предприятии.

q = L: = 17,765/ 159,485*100% =11,139 %

V = у: = 21,704/ 159,485*100% = 13,609%

Коэффициент вариации меньше 33%, что говорит о слабой вариации заработной платы работников на предприятии, т.е. о том, что средняя величина является типической характеристикой заработной плате работников (совокупность однородная).

В интервальных рядах распределения мода определяется по формуле -

Частота модального интервала, т. е. интервала, содержащего наибольшее число вариант;

Частота интервала, предшествующего модальному;

Частота интервала, следующего за модальным;

Длина модального интервала;

Нижняя граница модального интервала.

Для определения медианы в интервальном ряду воспользуемся формулой

где - кумулятивная (накопленная) частота интервала, предшествующего медианному;

Нижняя граница медианного интервала;

Частота медианного интервала;

Длина медианного интервала.

Медианный интервал - интервал, накопленная частота которого (=3+3+5+7) превышает половину суммы частот - (153,49; 167,32).

Рассчитаем асимметрию и эксцесс для чего составим новую рабочую таблицу:

Таблица 1.4

Фактические данные

Расчетные данные

Рассчитаем момент третьего порядка

Следовательно, асимметрия равна

Так как 0,3553 0,25, то асимметрия признается значительной.

Рассчитаем момент четвертого порядка

Следовательно, эксцесс равен

Так как < 0, то эксцесс является плосковершинным.

Степень асимметрии может быть определена с помощью коэффициента асимметрии Пирсона (Аs): осцилляция выборка стоимость товарооборот

где -- средняя арифметическая ряда распределения; -- мода; -- среднее квадратическое отклонение.

При симметричном (нормальном) распределении = Мо, следовательно, коэффициент асимметрии равен нулю. Если Аs > 0, то больше моды, следовательно, имеется правосторонняя асимметрия.

Если As < 0, то меньше моды, следовательно, имеется левосторонняя асимметрия. Коэффициент асимметрии может изменяться от -3 до +3.

Распределение не является симметричным, а имеет левостороннюю асимметрию.

ЗАДАЧА 2

Какова должна быть численность выборки, чтобы с вероятностью 0,954 ошибка выборки не превышала 0,04, если на основе предыдущих обследований известно, что дисперсия равна 0,24?

Решение

Объем выборки при бесповторном отборе рассчитывается по формуле:

t - коэффициент доверия (при вероятности 0,954 он равен 2,0; определяется по таблицам интегралов вероятности),

у2=0,24 - среднее квадратическое отклонение;

10000 чел. - численность выборки;

Дх =0,04 - предельная ошибка выборочной средней.

С вероятностью 95,4% можно утверждать, что численность выборки, обеспечивающая относительную погрешность не более 0,04, должна составлять не менее 566 семей.

ЗАДАЧА 3

Имеются следующие данные о доходах от основной деятельности предприятия, млн. руб.

Для анализа ряда динамики определите следующие показатели:

1) цепные и базисные:

Абсолютные приросты;

Темпы роста;

Темпы прироста;

2) средний

Уровень ряда динамики;

Абсолютный прирост;

Темп роста;

Темп прироста;

3) абсолютное значение 1% прироста.

Решение

1. Абсолютный прирост (Д у) - это разность между последующим уровнем ряда и предыдущим (или базисным):

цепной: Ду = уi - yi-1,

базисный: Ду = уi - y0,

уi - уровень ряда,

i - номер уровня ряда,

y0 - уровень базисного года.

2. Темп роста (Ту) - это отношение последующего уровня ряда и предыдущего (или базисного 2001 г.):

цепной: Ту = ;

базисный: Ту =

3. Темп прироста (Т Д ) - это отношение абсолютного прироста к предыдущему уровню, выраженное в %.

цепной: Ту = ;

базисный: Ту =

4. Абсолютное значение 1% прироста (А) - это отношение цепного абсолютного прироста к темпу прироста, выраженному в %.

А =

Средний уровень ряда рассчитывается по формуле средней арифметической.

Средний уровень доходов от основной деятельности за 4 года:

Средний абсолютный прирост рассчитывается по формуле:

где n - число уровней ряда.

В среднем за год доходы от основной деятельности выросли на 3,333 млн. руб.

Среднегодовой темп роста рассчитывается по формуле средней геометрической:

уn - конечный уровень ряда,

у0 - начальный уровень ряда.

Ту = 100% = 102,174 %

Среднегодовой темп прироста рассчитывается по формуле:

Т? = Ту - 100% = 102,74% - 100% = 2,74%.

Таким образом, в среднем за год доходы от основной деятельности предприятия увеличивались на 2,74%.

ЗАДАЧ А 4

Вычислить:

1. Индивидуальные индексы цен;

2. Общий индекс товарооборота;

3. Агрегатный индекс цен;

4. Агрегатный индекс физического объема продажи товаров;

5. Абсолютный прирост стоимости товарооборота и разложите по факторам (за счет изменения цен и количества проданных товаров);

6. Сделать краткие выводы по всем полученным показателям.

Решение

1. По условию, индивидуальные индексы цен по изделиям А, Б, В составили -

iрA=1.20; iрБ=1,15; iрВ=1.00.

2. Общий индекс товарооборота рассчитаем по формуле:

I w = = 1470/1045*100% = 140,67 %

Товарооборот вырос на 40,67 % (140,67%-100%).

В среднем цены на товары выросли на 10,24%.

Сумма дополнительных расходов покупателей от роста цен:

w(p) = ? p1q1 - ? p0q1 = 1470 - 1333,478= 136,522 млн. руб.

В результате роста цен покупателям пришлось дополнительно израсходовать 136,522 млн. руб.

4. Общий индекс физического объема товарооборота:

Физический объем товарооборота вырос на 27,61 %.

5. Определим общее изменение товарооборота во втором периоде по сравнению с первым периодом:

w = 1470- 1045 = 425 млн.руб.

за счет изменения цен:

W(р) = 1470 - 1333,478 = 136,522 млн. руб.

за счет изменения физического объема:

w(q) = 1333,478 - 1045= 288,478 млн. руб.

Товарооборот товаров увеличился на 40,67%. Цены в среднем по 3-м товарам выросли на 10,24%. Физический объем товарооборота увеличился на 27,61%.

В целом объем реализации увеличился на 425 млн.руб., в том числе за счет роста цен он вырос на 136,522 млн. руб., а за счет увеличения объемов продаж - на 288,478 млн. руб.

ЗАДАЧА 5

По 10 заводам одной отрасли имеются следующие данные.

№ завода

Выпуск продукции, тыс. шт. (Х)

На основе приведенных данных:

I) для подтверждения положений логического анализа о наличии корреляционной прямолинейной зависимости между факторным признаком (объемом выпуска продукции) и результативным признаком (расходом электроэнергии) нанесите исходные данные на график корреляционного поля и сделайте выводы о форме связи, укажите ее формулу;

2) определите параметры уравнения связи и нанесите полученную при этом теоретическую линию на график корреляционного поля;

3) исчислите линейный коэффициент корреляции,

4) поясните значения показателей, полученных в пунктах 2) и 3);

5) используя полученную модель, сделайте прогноз о возможном расходе электроэнергии на заводе с объемом производства 4,5 тыс. шт.

Решение

Данные признака - объем выпуска продукции (фактор), обозначим через хi; признака - расход электроэнергии (результат) через уi; точки с координатами (х, у) наносим на корреляционное поле ОХУ.

Точки корреляционного поля расположены вдоль некоторой прямой. Следовательно, связь - линейная, будем искать уравнение регрессии в виде прямой Уx=ax+b. Для его нахождения воспользуемся системой нормальных уравнений:

Составим расчетную таблицу.

По найденным средним составляем систему и решаем её относительно параметров а и b:

Итак, получим уравнение регрессии у на х: = 3,57692 х + 3,19231

Строим линию регрессии на корреляционном поле.

Подставляя в уравнение регрессии значения х из столбца 2, получим расчетные (столбец 7) и сравниваем их с данными у, что отражено в столбце 8. Кстати, правильность расчетов подтверждается и совпадением средних значений у и.

Коэффициент линейной корреляции оценивает тесноту зависимости между признаками х и у и рассчитывается по формуле

Угловой коэффициент прямой регрессии а (при х) характеризует направление выявленной зависимости признаков: при а>0 одинаковы, при а<0- противоположны. Его абсолютная величина - мера изменения результативного признака при изменении факторного на единицу измерения.

Свободный член прямой регрессии выявляет направление, а его абсолютное значение - количественную меру влияния на результативный признак всех прочих факторов.

Если < 0, то ресурс факторного признака отдельного объекта используется с меньшей, а при >0 с большей результативностью, чем в среднем по всему множеству объектов.

Проведём послерегрессионный анализ.

Коэффициент при х прямой регрессии равен 3,57692 >0, следовательно, с увеличением (уменьшением) выпуска продукции растёт (падает) расход электроэнергии. Увеличение выпуска продукции на 1 тыс. шт. даёт в среднем рост расход электроэнергии на 3,57692 тыс. кВт.ч.

2. Свободный член прямой регрессии равен 3,19231,следовательно, влияние прочих факторов увеличивает силу воздействия выпуска продукции на расход электроэнергии в абсолютном измерении на 3,19231 тыс. кВт.ч.

3. Коэффициент корреляции 0,8235 выявляет весьма тесную зависимость расхода электроэнергии от выпуска продукции.

По уравнению регрессионной модели легко делать прогнозы. Для этого в уравнение регрессии подставляют значения х - объем выпуска продукции и прогнозируют расход электроэнергии. При этом значения х можно брать не только в пределах заданного размаха, но и вне его.

Сделаем прогноз о возможном расходе электроэнергии на заводе с объемом производства 4,5 тыс. шт.

3,57692*4,5 + 3,19231= 19,288 45 тыс. кВт.ч.

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1. Захаренков С.Н. Социально-экономическая статистика: Учеб.-практ пособие. -Мн.: БГЭУ, 2002.

2. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики. - М.: ИНФРА - М., 2000.

3. Елисеева И.И. Статистика. - М.: Проспект, 2002.

4. Общая теория статистики / Под общ. ред. О.Э. Башиной, А.А. Спирина. - М.: Финансы и статистика, 2000.

5. Социально-экономическая статистика: Учеб.-практ. пособие / Захаренков С.Н. и др. - Мн.: ЕГУ, 2004.

6. Социально-экономическая статистика: Учеб. пособие. / Под ред. Нестерович С.Р. - Мн.: БГЭУ, 2003.

7. Теслюк И.Е., Тарловская В.А., Терлиженко Н. Статистика.- Минск, 2000.

8. Харченко Л.П. Статистика. - М.: ИНФРА - М, 2002.

9. Харченко Л.П., Долженкова В.Г., Ионин В.Г. Статистика. - М.: ИНФРА - М, 1999.

10. Экономическая статистика / Под ред. Ю.Н. Иванова - М., 2000.

Размещено на Allbest.ru

...

Подобные документы

    Расчет средней арифметической для интервального ряда распределения. Определение общего индекса физического объема товарооборота. Анализ абсолютного изменения общей стоимости продукции за счет изменения физического объема. Расчет коэффициента вариации.

    контрольная работа , добавлен 19.07.2010

    Сущность оптового, розничного и общественного товарооборота. Формулы расчета индивидуальных, агрегатных индексов товарооборота. Расчет характеристик интервального ряда распределения - среднего арифметического, моды и медианы, коэффициента вариации.

    курсовая работа , добавлен 10.05.2013

    Расчет планового и фактического объема продаж, процента выполнения плана, абсолютного изменения товарооборота. Определение абсолютного прироста, средних темпов роста и прироста денежных доходов. Расчет структурных средних: моды, медианы, квартиля.

    контрольная работа , добавлен 24.02.2012

    Интервальный ряд распределения банков по объему прибыли. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов. Расчет характеристик интервального ряда распределения. Вычисление средней арифметической.

    контрольная работа , добавлен 15.12.2010

    Формулы определения средних величин интервального ряда - моды, медианы, дисперсии. Расчет аналитических показателей рядов динамики по цепной и базисной схемам, темпов роста и прироста. Понятие сводного индекса себестоимости, цен, затрат и товарооборота.

    курсовая работа , добавлен 27.02.2011

    Понятие и назначение, порядок и правила построения вариационного ряда. Анализ однородности данных в группах. Показатели вариации (колеблемости) признака. Определение среднего линейного и квадратического отклонения, коэффициента осцилляции и вариации.

    контрольная работа , добавлен 26.04.2010

    Понятие моды и медианы как типичных характеристик, порядок и критерии их определения. Нахождение моды и медианы в дискретном и интервальном вариационном ряду. Квартили и децили как дополнительные характеристики вариационного статистического ряда.

    контрольная работа , добавлен 11.09.2010

    Построение интервального ряда распределения по группировочному признаку. Характеристика отклонения распределения частот от симметричной формы, расчет показателей эксцесса и ассиметрии. Анализ показателей бухгалтерского баланса или отчёта о прибылях.

    контрольная работа , добавлен 19.10.2014

    Преобразование эмпирического ряда в дискретный и интервальный. Определение средней величины по дискретному ряду с использованием ее свойств. Расчет по дискретному ряду моды, медианы, показателей вариации (дисперсия, отклонение, коэффициент осцилляции).

    контрольная работа , добавлен 17.04.2011

    Построение статистического ряда распределения организаций. Графическое определение значения моды и медианы. Теснота корреляционной связи с использованием коэффициента детерминации. Определение ошибки выборки среднесписочной численности работников.

Что такое группировка статистических данных, и как она связана с рядами распределения, было рассмотрено этой лекции, там же можно узнать, о том что такое дискретный и вариационный ряд распределения.

Ряды распределения одна из разновидностей статистических рядов (кроме них в статистике используются ряды динамики), используются для анализа данных о явлениях общественной жизни. Построение вариационных рядов вполне посильная задача для каждого. Однако есть правила, которые необходимо помнить.

Как построить дискретный вариационный ряд распределения

Пример 1. Имеются данные о количестве детей в 20 обследованных семьях. Построить дискретный вариационный ряд распределения семей по числу детей .

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Решение:

  1. Начнем с макета таблицы, в которую затем мы внесем данные. Так как ряды распределения имеют два элемента, то таблица состоять будет из двух колонок. Первая колонка это всегда варианта – то, что мы изучаем – ее название берем из задания (конец предложения с заданием в условиях) — по числу детей – значит наша варианта это число детей.

Вторая колонка это частота – как часто встречается наша варианта в исследуемом явление – название колонки так же берем из задания — распределения семей – значит наша частота это число семей с соответствующим количеством детей.

  1. Теперь из исходных данных выберем те значения, которые встречаются хотя бы один раз. В нашем случае это

И расставим эти данные в первой колонке нашей таблицы в логическом порядке, в данном случае возрастающем от 0 до 4. Получаем

И в заключение подсчитаем, сколько же раз встречается каждое значение варианты.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

В результате получаем законченную табличку или требуемый ряд распределения семей по количеству детей.

Задание . Имеются данные о тарифных разрядах 30 рабочих предприятия. Построить дискретный вариационный ряд распределения рабочих по тарифному разряду. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Как построить интервальный вариационный ряд распределения

Построим интервальный ряд распределения, и посмотрим чем же его построение отличается от дискретного ряда.

Пример 2. Имеются данные о величине полученной прибыли 16 предприятий, млн. руб. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Построить интервальный вариационный ряд распределения предприятий по объему прибыли, выделив 3 группы с равными интервалами.

Общий принцип построения ряда, конечно же, сохраниться, те же две колонки, те же варианта и частота, но в здесь варианта будет располагаться в интервале и подсчет частот будет вестись иначе.

Решение:

  1. Начнем аналогично предыдущей задачи с построения макета таблицы, в которую затем мы внесем данные. Так как ряды распределения имеют два элемента, то таблица состоять будет из двух колонок. Первая колонка это всегда варианта – то, что мы изучаем – ее название берем из задания (конец предложения с заданием в условиях) — по объему прибыли – значит, наша варианта это объем полученной прибыли.

Вторая колонка это частота – как часто встречается наша варианта в исследуемом явление – название колонки так же берем из задания — распределения предприятий – значит наша частота это число предприятий с соответствующей прибылью, в данном случае попадающие в интервал.

В итоге макет нашей таблицы будет выглядеть так:

где i – величина или длинна интервала,

Хmax и Xmin – максимальное и минимальное значение признака,

n – требуемое число групп по условию задачи.

Рассчитаем величину интервала для нашего примера. Для этого среди исходных данных найдем самое большое и самое маленькое

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 – максимальное значение 118 млн. руб., и минимальное 9 млн. руб. Проведем расчет по формуле.

В расчете получили число 36,(3) три в периоде, в таких ситуациях величину интервала нужно округлить до большего, чтобы после подсчетов не потерялось максимальное данное, именно поэтому в расчете величина интервала 36,4 млн. руб.

  1. Теперь построим интервалы – наши варианты в данной задаче. Первый интервал начинают строить от минимального значения к нему добавляется величина интервала и получается верхняя граница первого интервала. Затем верхняя граница первого интервала становится нижней границей второго интервала, к ней добавляется величина интервала и получается второй интервал. И так далее столько раз сколько требуется построить интервалов по условию.

Обратим внимание если бы мы не округлили величину интервала до 36,4, а оставили бы ее 36,3, то последнее значение у нас бы получилось 117,9. Именно для того чтобы не было потери данных необходимо округлять величину интервала до большего значения.

  1. Проведем подсчет количества предприятий попавших в каждый конкретный интервал. При обработке данных необходимо помнить, что верхнее значение интервала в данном интервале не учитывается (не включается в этот интервал), а учитывается в следующем интервале (нижняя граница интервала включается в данный интервал, а верхняя не включается), за исключением последнего интервала.

При проведении обработки данных лучше всего отобранные данные обозначить условными значками или цветом, для упрощения обработки.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Первый интервал обозначим желтым цветом – и определим сколько данных попадает в интервал от 9 до 45,4, при этом данное 45,4 будет учитываться во втором интервале (при условии что оно есть в данных) – в итоге получаем 7 предприятий в первом интервале. И так дальше по всем интервалам.

  1. (дополнительное действие ) Проведем подсчет общего объема прибыли полученного предприятиями по каждому интервалу и в целом. Для этого сложим данные отмеченные разными цветами и получим суммарное значение прибыли.

По первому интервалу — 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 млн. руб.

По второму интервалу — 48 + 57 + 48 + 56 + 63 = 272 млн. руб.

По третьему интервалу — 118 + 87 + 98 + 88 = 391 млн. руб.

Задание . Имеются данные о величине вклада в банке 30 вкладчиков, тыс. руб. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Построить интервальный вариационный ряд распределения вкладчиков, по размеру вклада выделив 4 группы с равными интервалами. По каждой группе подсчитать общий размер вкладов.

Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики всего объекта при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.

Статистическая сводка - это комплекс последовательных операций по обобщению конкретных единичных фактов, образующих совокупность, для выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Проведение статистической сводки включает следующие этапы :

  • выбор группировочного признака;
  • определение порядка формирования групп;
  • разработка системы статистических показателей для характеристики групп и объекта в целом;
  • разработка макетов статистических таблиц для представления результатов сводки.

Статистической группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным существенным для них признакам. Группировки являются важнейшим статистическим методом обобщения статистических данных, основой для правильного исчисления статистических показателей.

Различают следующие виды группировок: типологические, структурные, аналитические. Все эти группировки объединяет то, что единицы объекта разделены на группы по какому-либо признаку.

Группировочным признаком называется признак, по которому проводится разбиение единиц совокупности на отдельные группы. От правильного выбора группировочного признака зависят выводы статистического исследования. В качестве основания группировки необходимо использовать существенные, теоретически обоснованные признаки (количественные или качественные).

Количественные признаки группировки имеют числовое выражение (объем торгов, возраст человека, доход семьи и т. д.), а качественные признаки группировки отражают состояние единицы совокупности (пол, семейное положение, отраслевая принадлежность предприятия, его форма собственности и т. д.).

После того, как определено основание группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, объема совокупности, степени вариации признака.

Например, группировка предприятий по формам собственности учитывает муниципальную, федеральную и собственность субъектов федерации. Если группировка производится по количественному признаку, то тогда необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.

Когда определено число групп, то следует определить интервалы группировки. Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них.

Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в интервале. Величина интервала представляет собой разность между верхней и нижней границами.

Интервалы группировки в зависимости от их величины бывают: равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Величина равного интервала определяется по следующей формуле :

где Хmax, Хmin - максимальное и минимальное значения признака в совокупности; n - число групп.

Простейшая группировка, в которой каждая выделенная группа характеризуется одним показателем представляет собой ряд распределения.

Статистический ряд распределения - это упорядоченное распределение единиц совокупности на группы по определенному признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по качественным признакам, то есть признакам, не имеющим числового выражения (распределение по видам труда, по полу, по профессии и т.д.). Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам. Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Вариационными рядами называют ряды распределения, построенные по количественному признаку. Любой вариационный ряд состоит из двух элементов: вариантов и частот. Вариантами называются отдельные значения признака, которые он принимает в вариационном ряду, то есть конкретное значение варьирующего признака.

Частотами называются численности отдельных вариант или каждой группы вариационного ряда, то есть это числа, которые показывают, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот определяет численность всей совокупности, ее объем. Частостями называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частостей равна 1 или 100%.

В зависимости от характера вариации признака различают три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.

Ранжированный вариационный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.

Дискретный вариационный ряд характеризует распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, тарифный разряд, количество детей в семье, число работников на предприятии и др.

Если признак имеет непрерывное изменение, которые в определенных границах могут принимать любые значения («от - до»), то для этого признака нужно строить интервальный вариационный ряд . Например, размер дохода, стаж работы, стоимость основных фондов предприятия и др.

Примеры решения задач по теме «Статистическая сводка и группировка»

Задача 1 . Имеется информация о количестве книг, полученных студентами по абонементу за прошедший учебный год.

Построить ранжированный и дискретный вариационные ряды распределения, обозначив элементы ряда.

Решение

Данная совокупность представляет собой множество вариантов количества получаемых студентами книг. Подсчитаем число таких вариантов и упорядочим в виде вариационного ранжированного и вариационного дискретного рядов распределения.

Задача 2 . Имеются данные о стоимости основных фондов у 50 предприятий, тыс. руб.

Построить ряд распределения, выделив 5 групп предприятий (с равными интервалами).

Решение

Для решения выберем наибольшее и наименьшее значения стоимости основных фондов предприятий. Это 30,0 и 10,2 тыс. руб.

Найдем размер интервала: h = (30,0-10,2):5= 3,96 тыс. руб.

Тогда в первую группу будут входить предприятия, размер основных фондов которых составляет от 10,2 тыс. руб. до 10,2+3,96=14,16 тыс. руб. Таких предприятий будет 9. Во вторую группу войдут предприятия, размер основных фондов которых составит от 14,16 тыс. руб. до 14,16+3,96=18,12 тыс. руб. Таких предприятий будет 16. Аналогично найдем число предприятий, входящих в третью, четвертую и пятую группы.

Полученный ряд распределения поместим в таблицу.

Задача 3 . По ряду предприятий легкой промышленности получены следующие данные:

Произведите группировку предприятий по числу рабочих, образуя 6 групп с равными интервалами. Подсчитайте по каждой группе:

1. число предприятий
2. число рабочих
3. объем произведенной продукции за год
4. среднюю фактическую выработку одного рабочего
5. объем основных средств
6. средний размер основных средств одного предприятия
7. среднюю величину произведенной продукции одним предприятием

Результаты расчета оформите в таблицы. Сделайте выводы.

Решение

Для решения выберем наибольшее и наименьшее значения среднесписочного числа рабочих на предприятии. Это 43 и 256.

Найдем размер интервала: h = (256-43):6 = 35,5

Тогда в первую группу будут входить предприятия, среднесписочное число рабочих на которых составляет от 43 до 43+35,5=78,5 человек. Таких предприятий будет 5. Во вторую группу войдут предприятия, среднесписочное число рабочих на которых составит от 78,5 до 78,5+35,5=114 человек. Таких предприятий будет 12. Аналогично найдем число предприятий, входящих в третью, четвертую, пятую и шестую группы.

Полученный ряд распределения поместим в таблицу и вычислим необходимые показатели по каждой группе:

Вывод : Как видно из таблицы, вторая группа предприятий является самой многочисленной. В нее входят 12 предприятий. Самыми малочисленными являются пятая и шестая группы (по два предприятия). Это самые крупные предприятия (по числу рабочих).

Поскольку вторая группа самая многочисленная, объем произведенной продукции за год предприятиями этой группы и объем основных средств значительно выше других. Вместе с тем средняя фактическая выработка одного рабочего на предприятиях этой группы наибольшей не является. Здесь лидируют предприятия четвертой группы. На эту группу приходится и довольно большой объем основных средств.

В заключении отметим, что средний размер основных средств и средняя величина произведенной продукции одного предприятия прямо пропорциональны размерам предприятия (по числу рабочих).

Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку.

Назначение сервиса . С помощью онлайн-калькулятора Вы сможете:

  • построить вариационный ряд , построить гистограмму и полигон;
  • найти показатели вариации (среднюю, моду (в т.ч. и графическим способом), медиану, размах вариации, квартили, децили, квартильный коэффициент дифференциации, коэффициент вариации и другие показатели);

Инструкция . Для группировки ряда необходимо выбрать вид получаемого вариационного ряда (дискретный или интервальный) и указать количество данных (количество строк). Полученное решение сохраняется в файле Word (см. пример группировки статистических данных).

Количество исходных данных
",0);">

Если группировка уже осуществлена и заданы дискретный вариационный ряд или интервальный ряд , то необходимо воспользоваться онлайн-калькулятором Показатели вариации . Проверка гипотезы о виде распределения производится с помощью сервиса Изучение формы распределения .

Виды статистических группировок

Вариационный ряд . В случае наблюдений дискретной случайной величины одно и то же значение можно встретить несколько раз. Такие значения x i случайной величины записывают с указанием n i числа раз его появления в n наблюдениях, это и есть частота данного значения.
В случае непрерывной случайной величины на практике применяют группировку.
  1. Типологическая группировка – это разделение исследуемой качественно разнородной совокупности на классы, социально–экономические типы, однородные группы единиц. Для построения данной группировки используйте параметр Дискретный вариационный ряд.
  2. Структурной называется группировка , в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому–либо варьирующему признаку. Для построения данной группировки используйте параметр Интервальный ряд.
  3. Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой (см. аналитическая группировка ряда).

Принципы построения статистических группировок

Ряд наблюдений, упорядоченных по возрастанию, называется вариационным рядом . Группировочным признаком называется признак, по которому производится разбивка совокупности на отдельные группы. Его называют основанием группировки. В основание группировки могут быть положены как количественные, так и качественные признаки.
После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.

При использовании персональных компьютеров для обработки статистических данных группировка единиц объекта производится с помощью стандартных процедур.
Одна из таких процедур основана на использовании формулы Стерджесса для определения оптимального числа групп:

k = 1+3,322*lg(N)

Где k – число групп, N – число единиц совокупности.

Длину частичных интервалов вычисляют как h=(x max -x min)/k

Затем подсчитывают числа попаданий наблюдений в эти интервалы, которые принимают за частоты n i . Малочисленные частоты, значения которых меньше 5 (n i < 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
В качестве новых значений вариант берут середины интервалов x i =(c i-1 +c i)/2.

 


Читайте:



Завершился вывод войск ссср из афганистана

Завершился вывод войск ссср из афганистана

В 1987 году в Афганистане начала осуществляться политика национального примирения, принятая и одобренная на Пленуме ЦК НДПА в декабре 1986 года....

Новое направление: инноватика Сложно ли учиться на инноватике

Новое направление: инноватика Сложно ли учиться на инноватике

Предоставляют массу возможностей для выбора профессионального направления. Многие из предметов и направлений обозначены достаточно непонятными...

К чему снится племянница

К чему снится племянница

Учеными было установлено, что чаще всего, людям снится о любимых родственниках сон. Племянник, привидевшийся во время ночного отдыха, может...

Репейник: толкование сновидения

Репейник: толкование сновидения

Сонник репейник толкует как символ стремления к особой защищенности от возможных неприятностей. Сон, в котором вы видели одиноко стоящий куст,...

feed-image RSS