Czym jest korelacja? Współczynnik korelacji Pearsona

KorelacjaChcąc potwierdzić występowanie związku pomiędzy dwoma cechami, konieczne jest wskazanie ich korelacji. Dzieli się ona na różne rodzaje, a jej współczynnik jest liczony przy użyciu kilku znanych wzorów matematycznych.

Co to jest korelacja?

W ujęciu statystycznym, jest to korelacja oznacza występowanie związku między wybranymi zmiennymi (cechami, zjawiskami, właściwościami etc.). Wspomniany związek należy więc określić jako podobieństwo zachowania bądź współzachowanie.

Jeżeli więc dana cecha się zmienia (rośnie bądź maleje jej wartość), modyfikacji podlega również druga, związana z nią cecha (zmiana może być podobna bądź inna). Można więc w tym miejscu mówić o współzależności lub współwystępowaniu - coś od czegoś zależy, coś na coś wpływa.

Rodzaje korelacji

W statystyce wyróżnia się trzy rodzaje tego zjawiska:

  • korelacja dodatnia - można o niej powiedzieć wówczas, gdy wartości dwóch zmiennych zmieniają się w tym samym kierunku. Jeżeli więc jedna rośnie, druga zachowuje się w taki sam sposób. Przykładem korelacji dodatniej może być zależność między wzrostem cen towarów i wzrostem ich podaży. Jeżeli konkretny produkt kosztuje więcej, producenci są bardziej skłonni do zwiększenia jego produkcji,
  • korelacja ujemna - w tym przypadku sytuacja jest zgoła odmienna. Ujemna korelacja oznacza bowiem, że wartości zależnych od siebie zmiennych zmieniają się w kierunkach odwrotnych. Jeżeli więc jedna wartość rośnie, druga spada i na odwrót. Za przykład takiego zjawiska można uznać zależność między wzrostem cen i spadkiem popytu. Jeżeli koszt wybranych produktów zwiększa się, konsumenci wykazują mniejszą chęć do ich zakupu.
  • brak korelacji - mowa o sytuacji, w której zestawiane są zjawiska, cechy i właściwości nie mające ze sobą żadnego związku. Przykładem niech będzie brak związku między ceną płaszczy a populacją bizonów na świecie.

Jak obliczyć korelację?

Chcąc wykazać konkretną korelację, należy wyliczyć tak zwany współczynnik korelacji. Informuje on o sile związku między dwoma zmiennymi. Końcowy wynik podawany jest w przedziale od wartości -1 do 1. Im dalej od zera, tym silniejsza jest korelacja (wyniki powyżej zera oznaczają korelację dodatnią, a poniżej korelację ujemną).

Sposób wyliczenia współczynnika jest zależny od zastosowanych miar. W statystyce najczęściej wykorzystywany jest współczynnik korelacji Pearsona. Służy on do określania poziomu zależności linowej pomiędzy zmiennymi o charakterze losowym.

r (x,y) = cov (x,y) / σxy

cov (x,y) = E(x*y) - (E(x)*E(y))

gdzie:

r (x, y) - współczynnik korelacji między zmiennymi x i y,

cov (x, y) - kowariancja między zmiennymi x i y,

σ - odchylenie standardowe,

E - wartość oczekiwana

Prowadzi on do klasyfikacji korelacji na słabą i silną. W przypadku korelacji ujemnej, o słabym związku mówi się wtedy, gdy końcowy wynik równania wynosi od -0,1 do -0,5. Wartości poniżej -0,5 oznaczają silną korelację ujemną. Podobnie jest w przypadku związku dodatniego – wartości od 0,1 do 0,5 określają słabą korelację, a powyżej 0,5 mocną.

Klasyfikacja współczynnika korelacji jest często modyfikowana. Inna, równie popularna jej wersja prezentuje się następująco:

  • 0,1 < 0 <= 0,1 - korelacja słaba,
  • 0,3 < 0 <= 0,5 - korelacja przeciętna,
  • 0,5 < 0 <= 0,7 - korelacja wysoka,
  • 0,7 < 0 <= 0,9 - korelacja bardzo wysoka,
  • -1 lub 1 - korelacja pełna.

Wykorzystanie korelacji w praktyce

Ze względu na to, iż jest ona jedną z najpopularniejszych miar statystycznych, stosowana jest w wielu dziedzinach. Mowa w tym miejscu nie tylko o nauce, ale również o biznesie. Współczynnik korelacji służy bowiem między innymi do wykazywania związku pomiędzy notowaniami poszczególnych spółek a zmienną sytuacją w konkretnych sektorach gospodarki.

Korelacja statystyczna wykorzystywana jest także w metodach analitycznych. Spośród nich wymienić można między innymi analizę regresji, która zajmuje się estymacją wartości oczekiwanej danej zmiennej losowej, czy analizę czynnikową, związaną z procesem poszukiwania struktur w wybranym zbiorze zmiennych losowych.

Komentarze