Пятница, 29.11.2024
Мой сайт
Меню сайта
Статистика

Онлайн всего: 15
Гостей: 15
Пользователей: 0
Главная » 2019 » Март » 19 » Нулевая гипотеза и ошибки 1-го и 2-го рода
21:26
Нулевая гипотеза и ошибки 1-го и 2-го рода

Нулевая гипотеза и ошибки 1-го и 2-го рода

Пример взят у Кимбла. Только он, видимо, про монетки уже читать не мог. Писать тем более. У меня такой проблемы нет потому пусть монетку подбросили 30 раз и получили 21 орла и 9 решек.
Информация странная потому что противоречит общеизвестному утверждению, что должно быть примерно 15 орлов и 15 решек.
К этой информации можно относиться по-разному. Вроде бы можно утверждать по этой информации, что монета фальшивая. А может и нельзя. И непонятно с какого соотношения начинается уверенность в том что монета фальшивая. А если бы было 18 и 14? К тому же соотношение 21 и 9 редко но бывает.
Тут, на самом деле, присутствуют две информации. Первая это уверенность что монета сбалансирована. В данном случае информации (начальная и полученная) противоречат друг другу, что и сделало их рассматриваемым примером.
Эта начальная информация именуется нулевой гипотезой. Обычно полученные данные её опровергают. Потому что если не опровергают то у ситуации мало шансов быть замеченной и описанной. Происходит в природе какой-то классический случайный процесс. Но и пусть происходит дальше.
Возвращаюсь к монете. Пусть у меня получилось то самое 21:9. Можно посчитать вероятность такого события. Это 9%. Если я после этого считаю монету фальшивой а она всё-таки настоящая то я совершаю ошибку первого рода. Я же не знаю фальшивая она или нет. Это же не учебник, а конце которого написаны ответы к задачам.
Сама ситуация хороша тем. что возникла хотя бы противоречивая информация. Т.е были правильные или нет начальные представления, а потом были получены ещё данные. Это хотя бы повод насторожиться. А дальше уже можно решать, что делать с полученной информацией.
Человек может и сам каждый раз прикидывать то соотношение при котором он поверит в то, что монета фальшивая. Но бывают случаи когда информации слишком много для личного просмотра. Я, например, могу просмотреть все сколько-нибудь значимые графики по городу:
http://akostina76.ucoz.ru/blog/2019-03-18-5721

Но не хочу потому что легко могу представить объем информации при котором уже не смогу. Я хочу чтобы машина мне вытащила все необычные ситуации. А машине для этого надо точно указать, что ещё обычное, а что уже нет, то самую грань. А когда задаются такие значения, то хочется чтобы они имели какой-то смысл (в данном случае вероятность) а не брались с потолка как это обычно делается))).
При подбрасывании монеты может возникнуть ещё одна ситуация. Она интереснее и, вообще то, опаснее. Пусть монета фальшивая но она случайно упала 15:15. Случайно и такое бывает))). Если после этого посчитать её настоящей (на основе полученной информации) то это будет ошибка второго рода.
Я бы даже сказала что тут целых две ошибки. Ошибочные начальные представления, а потому ошибочная ещё и информация. Это что за ситуация такая???
Пример про суд присяжных:


Какой-то очень ловкий преступник получается. Тут явно присутствует ещё и третья информация. Что-то же заставило подбрасывать монету.
Вероятность событий неплохо бы считать. Без этого непонятно как пользоваться полезным инструментом, но про это завтра.
А сегодня просто для иллюстрации напомню ситуацию когда объем информации не позволял просмотреть всё глазами:
http://akostina76.ucoz.ru/blog/2015-12-13-2359

Завод срывает сроки по заказам. Интересует почему так и что с этим делать. Нулевая гипотеза тут – все заказы выполняются вовремя. Так должно быть, но так не происходит. Статистические данные в виде растянутых сроков это опровергают. Исключительно поэтому кого-то заинтересовало что там в цехе происходит. В случае монеты фактор, приводящий к необычному соотношению – вес. А в случае цеха какой фактор или факторы влияют на то что пошли отклонения от того что должно быть?
Повторная формовка означает что был брак (и бороться как-то надо с ним). А поздний запуск в производство означает что чем-то другим были заняты. Не исключено и то что той самой повторной формовкой по другим заказам. Но возможно есть ёщё какие-то организационные вещи, которые можно улучшить. Величины этих факторов я и пытаюсь определить хотя бы для самой группы продукции.

 

Просмотров: 257 | Добавил: akostina76 | Рейтинг: 0.0/0
Всего комментариев: 0
Имя *:
Email *:
Код *:
Форма входа
Поиск
Календарь
«  Март 2019  »
ПнВтСрЧтПтСбВс
    123
45678910
11121314151617
18192021222324
25262728293031
Архив записей
Друзья сайта
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz
  • Copyright MyCorp © 2024
    Бесплатный конструктор сайтов - uCoz