Пятница, 29.11.2024
Мой сайт
Меню сайта
Статистика

Онлайн всего: 22
Гостей: 22
Пользователей: 0
Главная » 2019 » Апрель » 5 » Мало статистических данных в справочнике
13:24
Мало статистических данных в справочнике

Мало статистических данных в справочнике

Я сегодня продолжу похоронную тематику:
https://akostina76.ucoz.ru/blog/2019-04-04-5756

Не от хорошей жизни. Просто по-моему, это единственная информация во всем статистическом справочнике, в которой можно исследовать факторы а не просто констатировать факты.
Там выделена конкретная группа (мужчины или женщины) и для этой группы дано значение (ожидаемая продолжительность жизни). Обычно разбивка только по регионам. Это тоже хорошо. Но когда невозможно узнать, как влияет сам фактор (картину его воздействия как воздействия звукового и визуального обучения в примере) мало что можно исследовать даже в целом по стране.
Пусть, например, я хочу проверить популярное объяснение высокой смертность. Мол, там много людей старшего возраста. Вроде логично. Но тут неявно предполагается что люди старшего возраста умирают чаще молодых. Это логично? Нет, это не логично. Это информация в данном случае целиком и полностью взятая с потолка. Если второй год идёт война, которая «дело молодых», то и смертей будет много и процент людей старшего возраста большой (из-за изменения ситуации в первый год). Т.е одни и те же статистические данные могут означать принципиально разные процессы.
А все потому что вместо предположений (в т.ч необоснованных) лучше всё-таки пользоваться корректно рассчитанной информацией.
Пусть меня пока не интересует информация по отдельным субъектам. Я, всё-таки, для начала хочу узнать картину воздействия типа «смерть» на разные возрастные группы (как раньше картину продолжительности жизни для мужчин и женщин).
Вот вся известная мне информация за 2012 год:
 

Население, чел

N

143 347 000,00

Смертность на 1000 чел

C/N*1000

13,30

% людей 65 лет и старше

N2/N*100

23,10

При всей странности этого действия я вполне могу нарисовать график по одной точке:

Это некий минимум информации, состоящий из одной цифры.
А теперь я хочу увеличить познания хотя бы до двух цифр:

Но я не могу это сделать. У меня нет этих двух цифр. Отсюда полная свобода фантазии. Я эту прямую могу нарисовать как угодно, предположив что угодно. И уже по этой как угодно нарисованной прямой делать глубокомысленные выводы. Т.е случай, когда статистика становится следующим этапом после «наглой лжи».
И так по всей информации. Я не могу сказать связан уровень образования с производительностью труда или нет, потому что у меня есть только отдельные цифры по образованию и производительности. Связать я их могу, только что-то предположив (обосновано или нет).
Если я предположу что при примерно таком возрастном составе люди старше 65 лет умирают в два раза чаще остальных то я могу подменить информацию по смертности отдельных групп средней смертностью и этим процентом населения.
Просто для порядка, как это всё считается:
 

Смертность на 1 чел

P=C/N

0,0133

Количнство умерших

C=P*N

1 906 515,10

Доля людей 65 лет и старше

N2/N

0,23

Кол-во людей 65 лет и старше

N2

33 113 157,00

Кол-во людей младше 65 лет

N1=N-N2

110 233 843,00

Замена процента смертности

P2=N2/N/10

0,0231

Расчётное кол-во умерших>65

P2=C2/N2=>C2=P2*N2

764 913,93

Расчет умерших <65

C1=C-C2

1 141 601,17

Смертность до 65

P1=C1/N1

0,0104

Смертность после 65

P2=C2/N2

0,0231

Отношение смертности

P2/P1

2,23

На самом деле я примитивно заменяю смертность старше 65 лет процентом этой группы, а смертность остальных считаю уже по этой полученной при таком предположении информации. График такой:

Я бы сравнила с настоящей информацией, но у меня её нет(((.
А пока её нет, даже аккуратно посчитанный коэффициент корреляции (обычно служащий для оценки связанности наборов данных) и его близкое к 1 значение – в значительной степени домыслы.
В данном конкретном случае домыслы, скорее всего, имеют примерно такой вид:

Т.е это не просто смелое утверждение, что те кто старше 65 умирают в два раза чаще а целая частотная характеристика с вероятностью смерти в каком-то возрасте. И для неё получается что площадь под графиком после 65 лет вдвое больше чем до.
И особо важно, что там для неё получается. Важно что получена она когда-то для каких-то людей в каких-то условиях. Другие люди и другие условия могут дать совсем другую картину, а значит выводы сделанные по такой картинке распределений никуда не будут годиться.

 

Просмотров: 198 | Добавил: akostina76 | Рейтинг: 0.0/0
Всего комментариев: 0
Имя *:
Email *:
Код *:
Форма входа
Поиск
Календарь
Архив записей
Друзья сайта
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz
  • Copyright MyCorp © 2024
    Бесплатный конструктор сайтов - uCoz