Данные по смертности и база
Данные брались тут:
http://www.demogr.nes.ru/index.php/ru/demogr_indicat/data
Коды причины смертности тут:
http://www.demogr.nes.ru/index.php/ru/demogr_indicat/data_description
Таблицы базы:
Исходные текстовые файлы (PopDa, DRc5a, DRa) засунуты в таблицы с той же структурой. Потом из них
сделаны таблицы по датам рождения:
Значения трендов смертности у меня посчитаны по GROUP=T и возрастов от 1930 по 1985 г.р.
По населению у меня таблицы (nas) есть, но нет
отчётов. Если что-то надо, то можно SQL строкой выбрать.
По причинам смертей все сложно. Во-первых, информация есть только по 2012 год.
Во-вторых, какая-то грязь в базе и потому значения скачены в текстовые строки
(иначе не залить даже с проверкой IsNumeric).
Конвертируются в числа они уже при выборке. В-третьих, откуда-то взялось задвоение. Я, не разбираясь, группирую по коду и беру
среднее. Там было исходных три файла.
Почему-то они вливали данные и не за свои периоды. Самый
большой там 700 тыс. строк. Потому довольно тяжело там все даже на сервере
(потому пока не стала разбираться).
Но самое интересное там с кодами причин смертности, которые разные для разных
диапазонов. Потому и возникло три справочника (pr1990, pr2006, pr2012).
Но реальных периодов, похоже, два. С 1989 по 1998 (pr1990). И с 1999 по 2012
(pr2006).
В 2006 году изменилась только одна позиция справочника. По номеру 241
было:
Другие и неуточненные транспортные несчастные случаи
стало
Пассажир других транспортных средств в дорожно-транспоттном
несчастном случае
… т.е хоть похоже по смыслу.
Все другие изменения никак не связаны. Самое смешное №94, который в справочнике
90-х был «Другие формы ишемической болезни сердца с гипертонической болезнью»
(одна из самых частых причин) а стал в справочнике нулевых – «Недостаточность
питания».
Чтобы это все как-то собрать вместе, в справочниках кроме основного кода,
появился расширенный:
При выборке данных по причинам (Отчёт №10) код из данных в зависимости от года
преобразуется к нужному виду:
В таблице причин ещё и 5-летние диапазоны, так что
дальше там просто последовательность IF по возрастам и выбор из конкретной
колонки. Т.е информация не точная, не для конкретного года рождения, а для
5-летнего диапазона.
Рассчитанные параметры трендов (статистика смертности по годам рождения):
Хранимые процедуры просмотров – отчётов - графиков:
|