Итак, коэффициент корреляции Пирсона - мера корреляции (линейной зависимости) между двумя выборками X и Y, принимающая значения от +1 до −1 включительно. Другими словами, коэффициент корреляции Пирсона характеризует существование линейной зависимости между двумя величинами. Равенство коэффициента "+1" указывает на строгую прямую линейную зависимость, "-1" - на обратную. Если коэффициент равен нулю, то выборки линейно независимы.
Пусть даны две выборки:

Коэффициент корреляции Пирсона рассчитывается по формуле:

где

Слабые стороны этой метрики:
- неустойчивость к выбросам
- С помощью коэффициента корреляции можно определить линейную зависимость между величинами, другие взаимосвязи выявляются методами регрессионного анализа
- Необходимо понимать различие понятий "независимость" и "некоррелированность". Из первого следует второе, но не наоборот
Ниже показаны примеры выборок и значения коэффициента Пирсона для каждой и зних. Картинка взята из Википедии:

Интерпретация величины коэффициента некоторыми исследователями:
Корреляция | Отрицательное | Положительное |
Отсутствует | от -0.09 до 0.0 | от 0.00 до 0.09 |
Малая | от -0.3 до -0.1 | от 0.1 до 0.3 |
Средняя | от -0.5 до -0.3 | от 0.3 до 0.5 |
Большая | от -1.0 до -0.5 | от 0.5 до 1.0 |
Комментариев нет:
Отправить комментарий