Нулевая гипотеза и ошибки 1-го и 2-го рода
Пример взят у Кимбла. Только он, видимо, про монетки уже читать не мог. Писать тем более. У меня такой проблемы нет потому пусть монетку подбросили 30 раз и получили 21 орла и 9 решек.
Информация странная потому что противоречит общеизвестному утверждению, что должно быть примерно 15 орлов и 15 решек.
К этой информации можно относиться по-разному. Вроде бы можно утверждать по этой информации, что монета фальшивая. А может и нельзя. И непонятно с какого соотношения начинается уверенность в том что монета фальшивая. А если бы было 18 и 14? К тому же соотношение 21 и 9 редко но бывает.
Тут, на самом деле, присутствуют две информации. Первая это уверенность что монета сбалансирована. В данном случае информации (начальная и полученная) противоречат друг другу, что и сделало их рассматриваемым примером.
Эта начальная информация именуется нулевой гипотезой. Обычно полученные данные её опровергают. Потому что если не опровергают то у ситуации мало шансов быть замеченной и описанной. Происходит в природе какой-то классический случайный процесс. Но и пусть происходит дальше.
Возвращаюсь к монете. Пусть у меня получилось то самое 21:9. Можно посчитать вероятность такого события. Это 9%. Если я после этого считаю монету фальшивой а она всё-таки настоящая то я совершаю ошибку первого рода. Я же не знаю фальшивая она или нет. Это же не учебник, а конце которого написаны ответы к задачам.
Сама ситуация хороша тем. что возникла хотя бы противоречивая информация. Т.е были правильные или нет начальные представления, а потом были получены ещё данные. Это хотя бы повод насторожиться. А дальше уже можно решать, что делать с полученной информацией.
Человек может и сам каждый раз прикидывать то соотношение при котором он поверит в то, что монета фальшивая. Но бывают случаи когда информации слишком много для личного просмотра. Я, например, могу просмотреть все сколько-нибудь значимые графики по городу:
http://akostina76.ucoz.ru/blog/2019-03-18-5721
Но не хочу потому что легко могу представить объем информации при котором уже не смогу. Я хочу чтобы машина мне вытащила все необычные ситуации. А машине для этого надо точно указать, что ещё обычное, а что уже нет, то самую грань. А когда задаются такие значения, то хочется чтобы они имели какой-то смысл (в данном случае вероятность) а не брались с потолка как это обычно делается))).
При подбрасывании монеты может возникнуть ещё одна ситуация. Она интереснее и, вообще то, опаснее. Пусть монета фальшивая но она случайно упала 15:15. Случайно и такое бывает))). Если после этого посчитать её настоящей (на основе полученной информации) то это будет ошибка второго рода.
Я бы даже сказала что тут целых две ошибки. Ошибочные начальные представления, а потому ошибочная ещё и информация. Это что за ситуация такая???
Пример про суд присяжных:
Какой-то очень ловкий преступник получается. Тут явно присутствует ещё и третья информация. Что-то же заставило подбрасывать монету.
Вероятность событий неплохо бы считать. Без этого непонятно как пользоваться полезным инструментом, но про это завтра.
А сегодня просто для иллюстрации напомню ситуацию когда объем информации не позволял просмотреть всё глазами:
http://akostina76.ucoz.ru/blog/2015-12-13-2359
Завод срывает сроки по заказам. Интересует почему так и что с этим делать. Нулевая гипотеза тут – все заказы выполняются вовремя. Так должно быть, но так не происходит. Статистические данные в виде растянутых сроков это опровергают. Исключительно поэтому кого-то заинтересовало что там в цехе происходит. В случае монеты фактор, приводящий к необычному соотношению – вес. А в случае цеха какой фактор или факторы влияют на то что пошли отклонения от того что должно быть?
Повторная формовка означает что был брак (и бороться как-то надо с ним). А поздний запуск в производство означает что чем-то другим были заняты. Не исключено и то что той самой повторной формовкой по другим заказам. Но возможно есть ёщё какие-то организационные вещи, которые можно улучшить. Величины этих факторов я и пытаюсь определить хотя бы для самой группы продукции.
|