Коэффициент корреляции
Здесь:
https://akostina76.ucoz.ru/blog/2019-04-04-5756
… у меня был пример про детей и методы обучения. Результат можно представить на графиках двумя разными способами:
Во-первых, выбрать координаты я могу так как мне удобно (хоть тип детей по оси X, хоть метод обучения). Во-вторых, и в том и с другом случае наличие связи между типом детей и методом обучения видно по тому, что прямые не параллельны.
Другой пример. Исследуется влияние длительности работы и продолжительности перерывов в ней на производительность труда. Результат:
Получилось, что идея 12-часового рабочего дня не так уж и неуместна. Только работать в итоге надо все-таки 8 часов, а между рабочими периодами должны быть длинные и частые периоды отдыха. Но тут интересен не этот результат, а то что длительность периода отдыха и работы никак не связаны. Т.е как при длинном периоде работы так и при коротком увеличение длительности отдыха добавит 30 лишних деталей к производительности труда. Точно также можно поменять время работы при коротком или длинном отдыхе. Добавится 40 деталей.
На графиках такая ситуация видна по параллельным прямым:
А теперь опять про ожидаемую продолжительность жизни мужчин и женщин по федеральным округам. Никто не запрещает мне нарисовать такой график:
… вместо кучи линий из двух точек. Видны тут и относительная параллельность участков графика и то что самый непараллельный кусок даёт Северо-Кавказский округ, т.е именно там особо сильно проявляется связь территории (а не только пола) с продолжительностью жизни.
А теперь я возьму и просто вычту 10 из ожидаемой продолжительности жизни женщин. Тогда будут такие графики:
… Тут сплошные параллельные участки, что означает, что женщины живут больше мужчин, но ничто другое (место жительства) на это не влияет. Связь есть только между полом и этой ожидаемой продолжительностью, других факторов не наблюдается.
А теперь я опять поменяю график – форму отображения информации. По оси X у меня будут данные для женщин, а по Y – они же минус 10. Вся информация таких параллельных графиков ляжет на прямую:
Реальные же цифры продолжительности жизни мужчин и женщин будут болтаться возле прямой:
Коэффициент корреляции показывает насколько хорошо точки ложатся на прямую. Если почти все почти на прямой, то этот коэффициент близок к 1.
Если всё в порядке с постановкой задачи, то этот коэффициент показывает насколько сильно взаимодействие параметров (факторов), т.е действуют они а не что-то другое.
Считается он так:
Для продолжительностей жизни по округам его значение = 0.9264.
|