Разделы сайта
Выбор редакции:
- Крейсер "красный крым" черноморского флота
- «31 спорный вопрос» русской истории: житие императора Николая II
- Лечебные свойства корня лопуха и его широкое применение в домашних условиях
- Природные ресурсы западной сибири
- Совместимость петуха и змеи в любовных отношениях и браке Он петух она змея совместимость
- Чемерица черная: прекрасная и опасная Противопоказания и побочные действия
- Чем интересна Свято-Михайло-Афонская Закубанская пустынь?
- Порционная сельдь под шубой на праздничный стол
- К чему снится шить во сне
- Примета — разбить зеркало случайно: что делать, если оно треснуло
Реклама
Интервальное оценивание генеральной доли. Расчет размера выборки |
Интервальное оценивание вероятности события. Формулы расчета численности выборки при собственно-случайном способе отбора.
Для определения вероятностей интересующих нас событий мы применяем выборочный метод : проводим n независимых экспериментов, в каждом из которых может произойти (или не произойти) событие А (вероятность р появления события А в каждом эксперименте постоянна). Тогда относительная частота p* появлений событий А в серии из n испытаний принимается в качестве точечной оценки для вероятности p появления события А в отдельном испытании. При этом величину p* называют выборочной долей появлений события А , а р - генеральной долей . В силу следствия из центральной предельной теоремы (теорема Муавра-Лапласа) относительную частоту события при большом объеме выборки можно считать нормально распределенной с параметрами M(p*)=p и Поэтому при n>30 доверительный интервал для генеральной доли можно построить, используя формулы:
При малом объеме выборки n≤30 предельная ошибка ε определяется по таблице распределения Стьюдента :
Формулы справедливы, если отбор проводился случайным повторным образом (генеральная совокупность бесконечна), в противном случае необходимо сделать поправку на бесповторность отбора (таблица). Средняя ошибка выборки для генеральной доли
Формулы расчета численности выборки при собственно-случайном способе отбора
Задачи о генеральной долеНа вопрос «Накрывает ли доверительный интервал заданное значение p 0 ?» - можно ответить, проверив статистическую гипотезу H 0:p=p 0 . При этом предполагается, что опыты проводятся по схеме испытаний Бернулли (независимы, вероятность p появления события А постоянна). По выборке объема n определяют относительную частоту p * появления события A: где m - количество появлений события А в серии из n испытаний. Для проверки гипотезы H 0 используется статистика, имеющая при достаточно большом объеме выборки стандартное нормальное распределение (табл. 1).Таблица 1 - Гипотезы о генеральной доле
Пример №1
. С помощью случайного повторного отбора руководство фирмы провело выборочный опрос 900 своих служащих. Среди опрошенных оказалось 270 женщин. Постройте доверительный интервал , с вероятностью 0.95 накрывающий истинную долю женщин во всем коллективе фирмы.
Пример №2
. Владелец автостоянки считает день «удачным», если автостоянка заполнена более, чем на 80 %. В течение года было проведено 40 проверок автостоянки, из которых 24 оказались «удачными». С вероятностью 0.98 найдите доверительный интервал для оценки истинной доли «удачных» дней в течение года.
Пример №3
. Проверив 2500 изделий в партии, обнаружили, что 400 изделий высшего сорта, а n–m – нет. Сколько надо проверить изделий, чтобы с уверенностью 95% определить долю высшего сорта с точностью до 0.01 ?
Пример №4
. Партия изделий принимается, если вероятность того, что изделие окажется соответствующим стандарту, составляет не менее 0.97. Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответствующих стандарту. Можно ли на уровне значимости α=0,02 принять партию?
Пример №5
. Два завода изготавливают однотипные детали. Для оценки их качества сделаны выборки из продукции этих заводов и получены следующие результаты. Среди 200 отобранных изделий первого завода оказалось 20 бракованных, среди 300 изделий второго завода - 15 бракованных.
По условию α=0,025 отсюда Ф(Ккр)=0,4875 и Ккр=2,24. При двусторонней альтернативе область допустимых значений имеет вид (-2,24;2,24). Наблюдаемое значение K набл =2,15 попадает в этот интервал, т.е. на данном уровне значимости нет оснований отвергать основную гипотезу. Заводы изготавливают изделия одинакового качества. Когда Вы задаете вопрос «Сколько мне потребуется респондентов для опроса?», Вы на самом деле спрашиваете: «Насколько большой должна быть моя выборка, чтобы точно оценить мою совокупность?» Принимая во внимание сложность этих понятий, мы разбили процесс на 5 шагов, давая Вам возможность легко рассчитать идеальный объем выборки и обеспечить точность результатов опроса. 5 шагов, с помощью которых Вы убедитесь, что Ваша выборка точно оценивает генеральную совокупность:Шаг 1 Что представляет собой Ваша генеральная совокупность?Под термином «генеральная совокупность» мы понимаем целую группу людей, мнение которой Вы собираетесь выяснить (выборка будет состоять из членов этой совокупности, которые фактически примут участие в опросе). К примеру, если Вы хотите понять, как найти рынок сбыта для зубной пасты во Франции, Вашей совокупностью будут жители Франции. А если Вы пытаетесь определить, сколько дней отпуска предпочли бы иметь люди, работающие на компанию по производству зубной пасты, то Ваша генеральная совокупность - сотрудники этой компании. Независимо от того, страна это или компания, установление генеральной совокупности - это важный первый шаг. После того как Вы определились с генеральной совокупностью, установите (приблизительно) ее численность. Например, во Франции живут около 65 миллионов человек, а в компании-производителе зубной пасты работает, скорее всего, гораздо меньше сотрудников. Получили нужную цифру? Хорошо, тогда идем дальше… Шаг 2 Какова требуемая точность?Этот шаг является своего рода оценкой того, на какой риск Вы готовы пойти в отношении возможной неточности ответов на опрос в связи тем фактом, что Вы не опрашиваете всю генеральную совокупность. Поэтому Вам следует ответить на два вопроса:
Шаг 3 Какого размера выборка мне нужна?В таблице, размещенной ниже, выберите приблизительный размер целевой совокупности и предел погрешности для определения количества требуемых завершенных опросов. Теперь, когда у Вас есть значения шага 1 и шага 2, по удобной таблице ниже определите размер требуемой выборки…
Примечание . Данные приведены только в качестве ориентировочных инструкций. Кроме того, для генеральной совокупности свыше 1 млн. цифры можно округлять до сотен. Шаг 4 Насколько отзывчивыми окажутся люди?К сожалению, не все, кому Вы отправите опрос, дадут на него ответ. Процент людей, заполнивших бланк полученного опроса, называют «процентной долей ответивших». Определение процентной доли ответивших на Ваш опрос поможет установить общее число экземпляров опроса, которое необходимо разослать для получения требуемого числа ответов. Процентная доля ответивших прямым образом зависит от ряда факторов, таких как отношения с целевой аудиторией, продолжительность и сложность опроса, предлагаемые поощрения и тема опроса. Для онлайн-опросов, в которых с получателями предварительно не были установлены отношения, процентная доля ответивших в 20-30% считается очень высокой. Более консервативным и вероятным является значение 10-14%, если Вы до этого не проводили опрос в данной совокупности. Шаг 5 Так скольким же людям отсылать опрос?Это легкий этап! Просто разделите число, полученное на шаге 3, на число, полученное на шаге 4. Это и есть Ваше волшебное число. К примеру, если Вам нужно, чтобы опрос заполнили 100 женщин, пользующихся шампунем, и Вы считаете, что 10% женщин, которым Вы отправили опрос, его заполнят, требуется отослать опрос 1000 женщин (100/10%)! Суммарная численность объектов наблюдения (люди, домохозяйства, предприятия, населенные пункты и т.д.), обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени. Примеры генеральных совокупностей
Выборка (Выборочная совокупность)Часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности. Репрезентативность выборкиСвойство выборки корректно отражать генеральную совокупность. Одна и та же выборка может быть репрезентативной и
нерепрезентативной для разных генеральных совокупностей.
В то же время, указанные выборки (при соблюдении прочих условий) могут отлично репрезентировать
москвичей-автовладельцев, небольшие и средние российские предприятия и покупателей, совершающих покупки на рынках
соответственно. Ошибка выборки (доверительный интервал)Отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности.
В некоторых случаях, когда известны истинные распределения, систематическую ошибку можно нивелировать введением квот или перевзвешиванием данных, но в большинстве реальных исследований даже оценить ее бывает достаточно проблематично. Типы выборокВыборки делятся на два типа:
1. Вероятностные выборки
2.Невероятностные выборки
Курс лекций по теории статистикиБолее подробную информацию по выборочным наблюдениям можно получить просмотрев . Необходимое количество респондентов зависит от целей опроса и того, насколько важна достоверность результатов. Чем выше достоверность Вы хотите получить, тем ниже должен быть допустимый предел погрешности. ОпределенияЧисленность совокупности Численность совокупности - это размер всей группы, которую Вы хотите представить в опросе.
Подумайте о потенциальном размере Вашей целевой совокупности. Например, если Вы отправляете опрос пользователям iPhone мужского пола, проживающим в определенном регионе, Вам может потребоваться провести небольшое исследование с целью определить, сколько всего мужчин соответствует этим критериям. Предел погрешности Предел погрешности указывает, насколько результаты отклоняются от фактических значений. Это процентное значение, означающее, с какой вероятностью мнения и поведение выборки опроса отклоняются от мнения и поведения общей совокупности. Чтобы рассчитать предел погрешности, используйте наш калькулятор предела погрешности . Чем меньше предел погрешности, тем точнее будет ответ при определенном уровне доверия. В общем случае, чем больше размер выборки, тем меньше предел погрешности. Чем ближе размер выборки к численности совокупности, тем более репрезентативными будут результаты. И именно поэтому, посмотрев на таблицу ниже, Вы можете заметить, что с уменьшением рекомендованного размера выборки увеличивается допустимая погрешность. Допустим, мы опросили 400 человек о том, поддерживают ли они президента своей страны, и 55% ответило утвердительно. Если уровень доверия равен 95%, а пределы погрешности составляют ±5%, то при стократном повторении опроса в одних и тех же условиях 95 раз из 100 ответ находился бы в пределах между 50% и 60%. Уровень доверия Уровень доверия указывает, насколько достоверными являются полученные результаты. Общепринятые стандарты, используемые исследователями: 90%, 95% и 99%. Уровень доверия 95% означает, что, если повторить один и тот же опрос при одинаковых условиях 100 раз, 95 раз из 100 результаты будут приблизительно находиться в пределах погрешности. При определении размера выборки используется z-оценка уровня доверия. Z-оценка - это мера стандартного отклонения определенной доли от средней величины.
Процентное значение Требования к размеру выборки могут меняться в зависимости от процентной доли выборки, которая дает определенный ответ. Например, если в предыдущем опросе было обнаружено, что 75% клиентов выражают удовлетворенность Вашим продуктом, и Вы хотите провести такой опрос снова, можно использовать p = 0,75 для расчета требуемого размера выборки. Если опрос проводится в первый раз, то, поскольку опросы обычно содержат более одного вопроса (и поэтому оценивать требуется более одного процентного значения), мы рекомендуем использовать p = 0,5 для расчета оптимального размера выборки. Это дает нам примерный размер выборки, который не будет ни слишком консервативным ни слишком свободным. Ниже приведена таблица, в которой указаны рекомендованные значения численности совокупности* для предела погрешности при уровне доверия 95%.
* Мы рассчитали рекомендованные размеры выборки по указанной выше формуле. В некоторых случаях размеры выборки были округлены вверх до 5 или 10. Для более точного расчета используйте наш калькулятор размера выборки . Вы отправляете родителям детей Вашей школы опрос с вопросом о том, поддерживают ли они продление учебного дня. Вопрос имеет варианты ответа «Да» и «Нет». Общее количество родителей (численность совокупности) - 10 000, и Вас устраивает предел погрешности ±10%. По таблице выше Вы можете определить, что в опросе должно принять участие не менее 100 человек. 70% из 100 опрошенных родителей ответили, что согласны на продление учебного дня. Таким образом, можно предположить, что если бы в опросе участвовали все 10 000 родителей, 60-80% людей поддержало бы продление учебного дня. Сколько людей следует попросить пройти опрос?Может определять, какому количеству людей нужно отправить опрос. Чем выше процентная доля ответивших, тем меньше людей необходимо попросить пройти опрос. Например, если Вам нужно 100 респондентов и Вы ожидаете, что 25% людей, приглашенных принять участие в опросе, ответят на него, Вам необходимо пригласить 400 человек. СОВЕТ. Если Вам требуется гарантированное количество респондентов, приобретите ответы на опрос в SurveyMonkey Audience. Вы укажете необходимое количество ответов, и мы найдем респондентов, соответствующих Вашим критериям целевой аудитории. КАЛЬКУЛЯТОРЫГенеральная совокупностьСуммарная численность объектов наблюдения (люди, домохозяйства, предприятия, населенные пункты и т.д.), обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени. Примеры генеральных совокупностей:- Все жители Москвы (10,6 млн. человек по данным переписи 2002 года)- Мужчины-Москвичи (4,9 млн. человек по данным переписи 2002 года)- Юридические лица России (2,2 млн. на начало 2005 года)- Розничные торговые точки, осуществляющие продажу продуктов питания (20 тысяч на начало 2008 года) и т.д. Выборка (Выборочная совокупность)Часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности. Репрезентативность выборкиСвойство выборки корректно отражать генеральную совокупность. Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей.Пример:- Выборка, целиком состоящая из москвичей, владеющих автомобилем, не репрезентирует все население Москвы. - Выборка из российских предприятий численностью до 100 человек не репрезентирует все предприятия России.- Выборка из москвичей, совершающих покупки на рынке, не репрезентирует покупательское поведение всех москвичей.В то же время, указанные выборки (при соблюдении прочих условий) могут отлично репрезентировать москвичей-автовладельцев, небольшие и средние российские предприятия и покупателей, совершающих покупки на рынках соответственно.Важно понимать, что репрезентативность выборки и ошибка выборки - разные явления. Репрезентативность, в отличие от ошибки никак не зависит от размера выборки.Пример:Как бы мы не увеличивали количество опрошенных москвичей-автовладельцев, мы не сможем репрезентировать этой выборкой всех москвичей. Ошибка выборки (доверительный интервал)Отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности.Ошибка выборки бывает двух видов - статистическая и систематическая. Статистическая ошибка зависит от размера выборки. Чем больше размер выборки, тем она ниже.Пример:Для простой случайной выборки размером 400 единиц максимальная статистическая ошибка (с 95% доверительной вероятностью) составляет 5%, для выборки в 600 единиц - 4%, для выборки в 1100 единиц - 3% Обычно, когда говорят об ошибке выборки, подразумевают именно статистическую ошибку.Систематическая ошибка зависит от различных факторов, оказывающих постоянное воздействие на исследование и смещающих результаты исследования в определенную сторону.Пример:- Использование любых вероятностных выборок занижает долю людей с высоким доходом, ведущих активный образ жизни. Происходит это в силу того, что таких людей гораздо сложней застать в каком-либо определенном месте (например, дома).- Проблема респондентов, отказывающихся отвечать на вопросы анкеты (доля «отказников» в Москве, для разных опросов, колеблется от 50% до 80%)В некоторых случаях, когда известны истинные распределения, систематическую ошибку можно нивелировать введением квот или перевзвешиванием данных, но в большинстве реальных исследований даже оценить ее бывает достаточно проблематично. Типы выборокВыборки делятся на два типа: 1. Вероятностные выборки
2.Невероятностные выборки
Калькулятор расчета ошибки и размера выборки(для простой случайной выборки)Пояснения к полям: Доверительная вероятность Ошибка выборки (доверительный интервал) Доля признака Ожидаемая доля признака, для которого рассчитывается ошибка. В случае, если данные о доле признака отсутствуют, необходимо использовать значение равное 50, при котором достигается максимальная ошибка. |
Читайте: |
---|
Новое
- «31 спорный вопрос» русской истории: житие императора Николая II
- Лечебные свойства корня лопуха и его широкое применение в домашних условиях
- Природные ресурсы западной сибири
- Совместимость петуха и змеи в любовных отношениях и браке Он петух она змея совместимость
- Чемерица черная: прекрасная и опасная Противопоказания и побочные действия
- Чем интересна Свято-Михайло-Афонская Закубанская пустынь?
- Порционная сельдь под шубой на праздничный стол
- К чему снится шить во сне
- Примета — разбить зеркало случайно: что делать, если оно треснуло
- Самостоятельные заговоры на удачу и деньги