Структура экономики (много цифр)
Все ВВП страны можно разделить на типы деятельности. За 2017 год получится так:
Одна цифра превратилась в 19. А длинные названия показывают, что, чтобы не мельчить ещё больше, пришлось группировать (например, сельское хозяйство объединить с рыболовством).
Всё это по 85 субъектам это более полутора тысяч цифр. Ни то чтобы всё это надо было засовывать в голову. Но с этим объемом информации надо как-то работать.
Первое, что приходит в голову – узнать частотную характеристику по виду деятельности, т.е посмотреть, что является скорее нормой, а что необычным.
Так, например, выглядит частотная характеристика по транспорту и хранению (№ 08):
… по которой видно, что в большинстве субъектов доля этого вида деятельности от 5.24% до 8.49% (второй столб).
А тех, кто находится в «хвосте» справа:
… можно смело считать необычными по этому параметру.
Необычность требует отдельных слов. Потому что, с какой стати мне пришло в голову использовать именно эту информацию как критерий? Нет у меня для этого таких уж весомых оснований. Это – такой же мой личный произвол, как и то, что необычными я посчитала почему-то последние 4 субъекта в списке (не 5 и не 3).
Попытаюсь пофантазировать о том, что означает эта информация. Например, что означает, что у большинства субъектов этого транспорта не очень много (горка слева, справа хвост)? Большинство частотных характеристик имеет сходный горно-хвостатый вид. Но ведь это можно считать какой-то сбалансированностью экономики. Всего немного, зато всё есть. А если чего-то слишком много, то это может означать не только то, что этого много, но и то, что остального слишком мало. Наверное, осталось добавить, что инструмент довольно грубый. Чтобы что-то вылезло в достаточно большом хозяйственном комплексе оно должно ну очень сильно выпирать. Т.е если даже такие графики показывают аномалию, то субъекты с аномалий действительно очень необычны.
Вернусь в графикам частотных характеристик, которых у меня образовалось 19 штук:
В них, хоть и в просуммированном виде, засунуты все 1615 штук отдельных цифр.
В таком количестве утомляют даже разноцветные графики. Хочется чего-то покомпактнее и поближе к итоговым выводам по всему этому объему информации.
Если приглядеться, то видно, что картинки – графики тоже можно сгруппировать потому что очень многие похожи по форме.
Все частотные распределения имеют свои названия:
https://akostina76.ucoz.ru/blog/2019-04-11-5776
… но мне не хочется усложнять текст этими умными словами. «Научный» термин «гора» вместо «нормального распределения» я слышала на заводе. Пусть так и будет. Но требуется некоторое уточнение – расширение. В смысле, гора может быть узкой (тогда получается один столбик как для транспортировки выше) и широкой (два столбика), как для торговли:
Было бы писано на языке статистики – говорилось бы о больших разбросе и дисперсии значений.
Пусть при одном столбике такой вид распределения называется «Гора и хвост», а при двух «Гора-2 и хвост».
Необычнее всего выглядит распределение по обрабатывающему производству:
Никак не назовёшь это горой. На равномерное распределение (т.е прямую горизонтальную линию) это похоже явно больше не смотря на снижение справа. Такая форма означает, у нас примерно одинаковое количество субъектов с разными долями обрабатывающих производств. Назову это «Равномерное»
Частоты по недвижимости:
… тоже показывают необычную картину. Целых два диапазона с некоторой натяжкой можно назвать «лидерами». Т.е это близко к частотной характеристике с двумя модами. Такой вид означает, что есть некое среднее (точнее наиболее частое) значение доли недвижимости. Но есть группа субъектов, в которой эта доля значительно выше. И таких достаточно много чтобы считать их группой. А на графике они образуют справа столбик там, где обычна спад из одного – двух экзотических субъектов. Назову «Гора, хвост и 2 моды».
Данные по здравоохранению:
… имеют справа значительно меньший хвост. Потому можно, наверное, назвать это просто «Гора» (без хвоста).
Частотная характеристика по рыбе и сельскому хозяйству выглядит так:
У горы есть два склона. В данном же случае левого склона нет. Такой вид означает, что этой отрасли (как и добычи полезных ископаемых) у большинства очень мало. Но, в отличие от этих ископаемых, нет небольшого числа тех, у кого этого нет совсем. Высоких столбиков тут два, потому назову это «Столбы-2 и хвост».
Всё это я делаю с единственной целью – отказаться от просмотра графиков и засунуть всю информацию на половину листа.
Вот, что у меня в результате получилось вместо обычных цифр по стране:
Здесь:
https://akostina76.ucoz.ru/blog/2020-02-14-6304
… для описания кровотока в разных сосудах используются не только графики но и несколько цифр, описывающих форму графиков, т.е позволяющих представить вид графика и без картинки.
В данном случае я картинки графиков заменила названиям и вытащила несколько уточняющих форму цифр.
По этой небольшой таблице я вижу, что в «тонкую горку» вошло 64% субъектов только для добычи полезных ископаемых. По прочим отраслям разнообразие значений больше.
Я вижу, что две разные группы по свойствам могут быть найдены при детальном изучении стройки, недвижимости и торговли. Там есть две (точнее полторы) моды в распределении. Если меня интересуют необычные субъекты, то вначале смотреть туда.
Ещё я вижу, что нет среднего по обрабатывающему производству. Это, в числе прочего, означает, что если я хочу найти самый «средний» субъект, то этот параметр надо исключить.
Ещё при таком поиске стоит исключить параметры – отрасли, в которых в среднее вошло слишком мало субъектов (например, в среднее по научно – технической деятельности вошло только 35 субъектов, это «фильтр» срежет больше половины списка).
Поискала я такие наиболее сбалансированные субъекты, т.е такие, которые входят в среднее («горки») по наибольшему числу параметров.
Лидером оказался Омск:
… он не попадает в средние группы только по научно- технической (3.5, т.е больше среднего) , строительству (4.1, т.е меньше среднего) и электричеству с газом (2.4, т.е меньше среднего).
Следующие по такой сбалансированности экономики, что ли:
Костромская область, Республика Башкортостан, Рязанская область, Тульская область, Хабаровский край, Челябинская область
Вот таким сложным путём получен… не знаю что означающий результат. Отмеченные на карте субъекты, конечно разные, Хотя, с точки зрения экономического окружения, они очень похожи. Может быть можно говорить, что такое разнообразие позволяет проще найти занятие по душе. Возможно, такие места менее чувствительные к кризисам. Всё то же разнообразие, возможно, позволяет прожить на что-то другое, если у кого-то (одного из многих) начались проблемы. Чисто теоретически хорошо, когда есть много всего по чуть-чуть (по чуть-чуть процента, а не количества).
|