Разделы сайта
Выбор редакции:
- Крейсер "красный крым" черноморского флота
- «31 спорный вопрос» русской истории: житие императора Николая II
- Лечебные свойства корня лопуха и его широкое применение в домашних условиях
- Природные ресурсы западной сибири
- Совместимость петуха и змеи в любовных отношениях и браке Он петух она змея совместимость
- Чемерица черная: прекрасная и опасная Противопоказания и побочные действия
- Чем интересна Свято-Михайло-Афонская Закубанская пустынь?
- Порционная сельдь под шубой на праздничный стол
- К чему снится шить во сне
- Примета — разбить зеркало случайно: что делать, если оно треснуло
Реклама
Взвешенная дисперсия для вариационного ряда равна. Виды дисперсий |
По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города: Определите:1) размах вариации; 2) средний размер вклада; 3) среднее линейное отклонение; 4) дисперсию; 5) среднее квадратическое отклонение; 6) коэффициент вариации вкладов. Решение:Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей. Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200. 1) Определим размах вариации как разность между наибольшим и наименьшим значением признака: Размах вариации размера вклада равен 1000 рублей. 2) Средний размер вклада определим по формуле средней арифметической взвешенной. Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов. Среднее значение первого интервала будет равно: второго - 500 и т. д. Занесём результаты вычислений в таблицу:
Средний размер вклада в Сбербанке города будет равен 780 рублей: 3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней: Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий: 1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2). 2. Определяются абсолютные отклонения вариант от средней: 3. Полученные отклонения умножаются на частоты: 4. Находится сумма взвешенных отклонений без учёта знака: 5. Сумма взвешенных отклонений делится на сумму частот: Удобно пользоваться таблицей расчётных данных:
Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля. 4) Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической. Расчёт дисперсии в интервальных рядах распределения производится по формуле: Порядок расчёта дисперсии в этом случае следующий: 1. Определяют среднюю арифметическую взвешенную, как показано в п. 2). 2. Находят отклонения вариант от средней: 3. Возводят в квадрат отклонения каждой варианты от средней: 4. Умножают квадраты отклонений на веса (частоты): 5. Суммируют полученные произведения: 6. Полученная сумма делится на сумму весов (частот): Расчёты оформим в таблицу:
В случае, если совокупность разбита на группы по изучаемому признаку, то для данной совокупности могут быть исчислены следующие виды дисперсии: общая, групповые (внутригрупповые), средняя из групповых (средняя из внутригрупповых), межгрупповая. Первоначально рассчитывает коэффициент детерминации, который показывает какую часть общей вариации изучаемого признака составляет вариация межгрупповая, т.е. обусловленная группировочным признаком: Эмпирическое корреляционное отношение характеризует тесноту связи между признаками группировочным (факторным) и результативным. Эмпирическое корреляционное отношение может принимать значения от 0 до 1. Для оценки тесноты связи на основе показателя эмпирического корреляционного отношения можно воспользоваться соотношениями Чеддока: Пример 4. Имеются следующие данные о выполнении работ проектно-изыскательскими организациями разной формы собственности: Определить: 1) общую дисперсию; 2) групповые дисперсии; 3) среднюю из групповых дисперсий; 4) межгрупповую дисперсию; 5) общую дисперсию на основе правила сложения дисперсий; 6) коэффициент детерминации и эмпирическое корреляционное отношение. Сделайте выводы. Решение: 1. Определим средний объём выполнения работ предприятий двух форм собственности: Рассчитаем общую дисперсию: 2. Определим групповые средние: млн руб.; млн руб. Групповые дисперсии: ; 3. Рассчитаем среднюю из групповых дисперсий: 4. Определим межгрупповую дисперсию: 5. Рассчитаем общую дисперсию на основе правила сложения дисперсий: 6. Определим коэффициент детерминации: . Таким образом, объём работ, выполненных проектно-изыскательскими организациями на 22% зависит от формы собственности предприятий. Эмпирическое корреляционное отношение рассчитываем по формуле . Величина рассчитанного показателя свидетельствует о том, что зависимость объема работ от формы собственности предприятия невелика. Пример 5. В результате обследования технологической дисциплины производственных участков получены следующие данные: Определите коэффициент детерминации Вариационный размах (или размах вариации) - это разница между максимальным и минимальным значениями признака: В нашем примере размах вариации сменной выработки рабочих составляет: в первой бригаде R=105-95=10 дет., во второй бригаде R=125-75=50 дет. (в 5 раз больше). Это говорит о том, что выработка 1-й бригады более «устойчива», но резервов роста выработки больше у второй бригады, т.к. в случае достижения всеми рабочими максимальной для этой бригады выработки, ею может быть изготовлено 3*125=375 деталей, а в 1-й бригаде только 105*3=315 деталей.
Среднесменная выработка рабочих: 1 Расчет дисперсии способом моментовВычисление дисперсий связано с громоздкими расчетами (особенно если средняя величина выражена большим числом с несколькими десятичными знаками). Расчеты можно упростить, если использовать упрощенную формулу и свойства дисперсии.
, , то или
Порядок расчета:
2 Расчет дисперсии альтернативного признакаСреди признаков, изучаемых статистикой, есть и такие, которым свойственны лишь два взаимно исключающих значения. Это альтернативные признаки. Им придается соответственно два количественных значения: варианты 1 и 0. Частостью варианты 1, которая обозначается p, является доля единиц, обладающих данным признаком. Разность 1-р=q является частостью варианты 0. Таким образом,
Средняя арифметическая альтернативного признака Дисперсия альтернативного признака 3 Межгрупповая дисперсия. Правило сложения дисперсийДисперсия, в отличие от других характеристик вариации, является аддитивной величиной. То есть в совокупности, которая разделена на группы по факторному признаку х, дисперсия результативного признака y может быть разложена на дисперсию в каждой группе (внутригрупповую) и дисперсию между группами (межгрупповую). Тогда, наряду с изучением вариации признака по всей совокупности в целом, становится возможным изучение вариации в каждой группе, а также между этими группами. Общая дисперсия
измеряет вариацию признака у
по всей совокупности под влиянием всех факторов, вызвавших эту вариацию (отклонения). Она равна среднему квадрату отклонений отдельных значений признака у
от общей средней и может быть вычислена как простая или взвешенная дисперсия.
В данном примере рабочие разделены на две группы по факторному признаку х
– квалификации, которая характеризуется их разрядом. Результативный признак – выработка – варьируется как под его влиянием (межгрупповая вариация), так и за счет других случайных факторов (внутригрупповая вариация). Задача заключается в измерении этих вариаций с помощью трех дисперсий: общей, межгрупповой и внутригрупповой.
Эмпирический коэффициент детерминации показывает долю вариации результативного признака у
под влиянием факторного признака х
. Остальная часть общей вариации у
вызвана изменением прочих факторов. В примере , что свидетельствует о тесной связи между производительностью труда рабочих и их квалификацией. Наряду с изучением вариации признака по всей по всей совокупности в целом часто бывает необходимо проследить количественные изменения признака по группам, на которые разделяется совокупность, а также и между группами. Такое изучение вариации достигается посредством вычисления и анализа различных видов дисперсии.
Межгрупповая дисперсия (δ) характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора, положенного в основание группировки. Она рассчитывается по формуле:
Внутригрупповая дисперсия (σ)
отражает случайную вариацию, т.е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она вычисляется по формуле:
Средняя из внутригрупповых дисперсий : . Существует закон, связывающий 3 вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсии: .
В анализе широко используется показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии. Он носит название эмпирического коэффициента детерминации (η 2):
.
Пример №1 . Таблица 1 - Производительность труда двух групп рабочих одного из цехов НПО «Циклон» Рассчитаем общую и групповые средние и дисперсии:Исходные данные для вычисления средней из внутригрупповых и межгрупповой дисперсии представлены в табл. 2.
. Межгрупповая дисперсия Общая дисперсия: Таким образом, эмпирическое корреляционное соотношение: . Наряду с вариацией количественных признаков может наблюдаться и вариация качественных признаков. Такое изучение вариации достигается посредством вычисления следующих видов дисперсий: Внутригрупповая дисперсия доли определяется по формуле где n i – численность единиц в отдельных группах.Доля изучаемого признака во всей совокупности, которая определяется по формуле: Три вида дисперсии связаны между собой следующим образом: . Это соотношение дисперсий называется теоремой сложения дисперсий доли признака. Однако только этой характеристики ещё не достаточно для исследования случайной величины. Представим двух стрелков, которые стреляют по мишени. Один стреляет метко и попадает близко к центру, а другой… просто развлекается и даже не целится. Но что забавно, его средний результат будет точно таким же, как и у первого стрелка! Эту ситуацию условно иллюстрируют следующие случайные величины: «Снайперское» математическое ожидание равно , однако и у «интересной личности»: – оно тоже нулевое! Таким образом, возникает потребность количественно оценить, насколько далеко рассеяны пули (значения случайной величины) относительно центра мишени (математического ожидания). Ну а рассеяние с латыни переводится не иначе, как дисперсия . Посмотрим, как определяется эта числовая характеристика на одном из примеров 1-й части урока: Там мы нашли неутешительное математическое ожидание этой игры, и сейчас нам предстоит вычислить её дисперсию, которая обозначается через . Выясним, насколько далеко «разбросаны» выигрыши/проигрыши относительно среднего значения. Очевидно, что для этого нужно вычислить разности между значениями случайной величины и её математическим ожиданием : –5 – (–0,5) = –4,5 Теперь вроде бы нужно просуммировать результаты, но этот путь не годится – по той причине, что колебания влево будут взаимоуничтожаться с колебаниями вправо. Так, например, у стрелка-«любителя» (пример выше) разности составят , и при сложении дадут ноль, поэтому никакой оценки рассеяния его стрельбы мы не получим. Чтобы обойти эту неприятность можно рассмотреть модули
разностей, но по техническим причинам прижился подход, когда их возводят в квадрат. Решение удобнее оформить таблицей: – определение дисперсии. Из определения сразу понятно, что дисперсия не может быть отрицательной – возьмите на заметку для практики! Вспоминаем, как находить матожидание. Перемножаем квадраты разностей на соответствующие вероятности (продолжение таблицы)
: Не кажется ли вам, что на фоне выигрышей результат получился великоватым? Всё верно – мы возводили в квадрат, и чтобы вернуться в размерность нашей игры, нужно извлечь квадратный корень. Данная величина называется средним квадратическим отклонением
и обозначается греческой буквой «сигма»: Иногда это значение называют стандартным отклонением . В чём его смысл? Если мы отклонимся от математического ожидания влево и вправо на среднее квадратическое отклонение: Однако так сложилось, что при анализе рассеяния почти всегда оперируют понятием дисперсии. Давайте разберёмся, что она означает применительно к играм. Если в случае со стрелками речь идёт о «кучности» попаданий относительно центра мишени, то здесь дисперсия характеризует две вещи: Во-первых, очевидно то, что при увеличении ставок, дисперсия тоже возрастает. Так, например, если мы увеличим в 10 раз, то математическое ожидание увеличится в 10 раз, а дисперсия – в 100 раз (коль скоро, это квадратичная величина) . Но, заметьте, что сами-то правила игры не изменились! Изменились лишь ставки, грубо говоря, раньше мы ставили 10 рублей, теперь 100. Второй, более интересный момент состоит в том, что дисперсия характеризует стиль игры. Мысленно зафиксируем игровые ставки на каком-то определённом уровне , и посмотрим, что здесь к чему: Игра с низкой дисперсией – это осторожная игра. Игрок склонен выбирать самые надёжные схемы, где за 1 раз он не проигрывает/выигрывает слишком много. Например, система «красное/чёрное» в рулетке (см. Пример 4 статьи Случайные величины ) . Игра с высокой дисперсией. Её часто называют дисперсионной игрой. Это авантюрный или агрессивный стиль игры, где игрок выбирает «адреналиновые» схемы. Вспомним хотя бы «Мартингейл» , в котором на кону оказываются суммы, на порядки превосходящие «тихую» игру предыдущего пункта. Показательна ситуация в покере: здесь есть так называемые тайтовые игроки, которые склонны осторожничать и «трястись» над своими игровыми средствами (банкроллом) . Неудивительно, что их банкролл не подвергается значительным колебаниям (низкая дисперсия). Наоборот, если у игрока высокая дисперсия, то это агрессор. Он часто рискует, делает крупные ставки и может, как сорвать огромный банк, так и програться в пух и прах. То же самое происходит на Форексе, и так далее – примеров масса. Причём, во всех случаях не важно – на копейки ли идёт игра или на тысячи долларов. На любом уровне есть свои низко- и высокодисперсионные игроки. Ну а за средний выигрыш, как мы помним, «отвечает» математическое ожидание . Наверное, вы заметили, что нахождение дисперсии – есть процесс длительный и кропотливый. Но математика щедрА: Формула для нахождения дисперсииДанная формула выводится непосредственно из определения дисперсии, и мы незамедлительно пускаем её в оборот. Скопирую сверху табличку с нашей игрой: Вычислим дисперсию вторым способом. Сначала найдём математическое ожидание – квадрата случайной величины . По определению математического ожидания
: Таким образом, по формуле: Как говорится, почувствуйте разницу. И на практике, конечно, лучше применять формулу (если иного не требует условие). Осваиваем технику решения и оформления: Пример 6 Найти её математическое ожидание, дисперсию и среднее квадратическое отклонение. Эта задача встречается повсеместно, и, как правило, идёт без содержательного смысла. Решение
: Основные вычисления удобно свести в таблицу. Сначала в верхние две строки записываем исходные данные. Затем рассчитываем произведения , затем и, наконец, суммы в правом столбце: Собственно, почти всё готово. В третьей строке нарисовалось готовенькое математическое ожидание: . Дисперсию вычислим по формуле: И, наконец, среднее квадратическое отклонение: Все вычисления можно провести на калькуляторе, а ещё лучше – в Экселе:
вот здесь уже трудно ошибиться:) Ответ : Желающие могут ещё более упростить свою жизнь и воспользоваться моим калькулятором (демо) , который не только моментально решит данную задачу, но и построит тематические графики (скоро дойдём) . Программу можно скачать в библиотеке – если вы загрузили хотя бы один учебный материал, либо получить другим способом . Спасибо за поддержку проекта! Пара заданий для самостоятельного решения: Пример 7 Вычислить дисперсию случайной величины предыдущего примера по определению. И аналогичный пример: Пример 8 Дискретная случайная величина задана своим законом распределения: Да, значения случайной величины бывают достаточно большими (пример из реальной работы) , и здесь по возможности используйте Эксель. Как, кстати, и в Примере 7 – это быстрее, надёжнее и приятнее. Решения и ответы внизу страницы. В заключение 2-й части урока разберём ещё одну типовую задачу, можно даже сказать, небольшой ребус: Пример 9 Дискретная случайная величина может принимать только два значения: и , причём . Известна вероятность , математическое ожидание и дисперсия . Решение
: начнём с неизвестной вероятности. Так как случайная величина может принять только два значения, то сумма вероятностей соответствующих событий: и поскольку , то . Осталось найти …, легко сказать:) Но да ладно, понеслось. По определению математического ожидания: – и больше из этого уравнения ничего не выжать, разве что можно переписать его в привычном направлении: или: О дальнейших действиях, думаю, вы догадываетесь. Составим и решим систему: Десятичные дроби – это, конечно, полное безобразие; умножаем оба уравнения на 10: и делим на 2: Вот так-то лучше. Из 1-го уравнения выражаем:
В результате получено квадратное уравнение
, находим его дискриминант: и у нас получается два решения: 1) если , то ; 2) если , то . Условию удовлетворяет первая пара значений. С высокой вероятностью всё правильно, но, тем не менее, запишем закон распределения: |
Читайте: |
---|
Новое
- «31 спорный вопрос» русской истории: житие императора Николая II
- Лечебные свойства корня лопуха и его широкое применение в домашних условиях
- Природные ресурсы западной сибири
- Совместимость петуха и змеи в любовных отношениях и браке Он петух она змея совместимость
- Чемерица черная: прекрасная и опасная Противопоказания и побочные действия
- Чем интересна Свято-Михайло-Афонская Закубанская пустынь?
- Порционная сельдь под шубой на праздничный стол
- К чему снится шить во сне
- Примета — разбить зеркало случайно: что делать, если оно треснуло
- Самостоятельные заговоры на удачу и деньги