Gyilkos korreláció

  • Debreczeni Csaba Szerző:
  • Közzétéve:
     Olvasási idő: 4 perc   

Tudjuk vajon, hogy mit kell megvizsgálni ahhoz, hogy előre jelezzük, hogy egy adott évben hányan fognak a medencéjükben megfulladni? Nos elég azt, hogy Nicholas Cage hány filmben szerepel. A két adatsor közötti korreláció 1999 és 2009 között 66,6%-os volt, ahogy az az alábbi ábrán is látható. Nyilván, a legtöbben megmosolyogják ezt az „elemzést”, pedig az élet tele van ilyen hamis korrelációkkal. Valamilyen adatsorról azt gondoljuk, hogy megmagyaráz egy másikat, aztán mindez sok esetben csak a véletlen, vagy a “gondos” kiválasztás műve.

A korreláció két adatsor közötti lineáris kapcsolatot méri. Ha van két részvénytársaság, amely közül az egyik esernyőt árul, a másik pedig jégkrémet, akkor ha esős idő van a kettő közötti korreláció inkább negatív lesz, mert nyilvánvaló, hogy az egyik cégnek akkor jó, ha eső van, míg a másiknak akkor, ha süt a nap. A két cég részvényeinek hozama között azonban semmilyen kapcsolat nincs, ami összeköti őket, az az időjárás.

Az időjárás, aminek az emberi természetre is hatása van. Lépten-nyomon olyan emberekkel találkozom, akik panaszkodnak az időjárásra. Hetek óta esős, hűvös idő van, és állítólag ez még folytatódni is fog. Egyszer egy ügyfelem felhívott, hogy “Csaba, adjunk el mindent”. Kérdezem tőle: miért? Öt napja esik az eső, „kilátástalan” vagyok. Ez persze régen volt, amikor még nem volt ennyire elterjedt az online kereskedés. Amikor még számított, hogy milyen az idő.

Egy régi anekdota szerint egyszer Chicagóban rémes idő volt, hetek óta esett az eső. A traderek csak ültek, unták magukat, hiszen megbízásuk sem nagyon volt. Majd az egyik megszólalt, shortoljuk a gyapotot! De mégis miért? – kérdezték a többiek. Mert a gyapotnak tűző nap kell, itt hetek óta 10 fok van és esik az eső. Remek ötlet. Mindenki shortolni kezdte a gyapotot. Aztán kiderült, hogy ahol a növény terem, ott hetek óta kánikula van.

Az alábbi ábra a Dow Jones ipari átlag és az időjárás kapcsolatát szemlélteti 1965 és 1995 között. Bámulatos, rossz időben esik az index, napsütéses időben emelkedik. De ha több napsütéses nap van, mint felhős, és a tőzsde inkább emelkedik, mintsem csökken, akkor máris megmagyaráztuk ezt az anomáliát. De ettől függetlenül az időjárás befolyásolja az emberi hangulatot. Persze a közgazdászok szerint nem.

Forrás: saját szerkesztés, National Weather Service, finance.yahoo.com

De térjünk vissza kicsit a korrelációra. Minden adatsor között tudunk összefüggést keresni. Ha van 1000 adatsorunk, nehéz lesz legalább 5-10 olyat nem találni, amelyek között tökéletes a korreláció. De a korreláció nem jelent ok-okozati kapcsolatot. Egyszerűen csak együtt mozognak az adatok, sokszor a véletlen miatt, vagy valamilyen közös faktor miatt, amit kihagyunk a számításból, mint például a fenti példában az időjárás.

Ha a korreláció értéke-1, akkor a két adatsor tökéletesen ellentétesen mozog, ha +1, akkor egy irányba tartanak. De igazából értelmezhető következtetést csak akkor tudunk levonni, ha a korreláció értéke körülbelül -/+ 0,8 alatt vagy fölött van. Ez pedig már szemmel is látható, nem kell hozzá semmilyen modell.

Szóval óvatosan a korrelációval, az esetek többségében nem magyaráz meg semmit sem, ha pedig igen, akkor sokszor csak ideig-óráig.

Szeretne hasonló cikkekről folyamatosan értesülni?

  • Engedélyezze a böngésző általi weboldal-értesítéseket, így az új blogbejegyzéseinkről azonnal értesülhet.
  • Iratkozzon fel hírlevelünkre ezen a linken, így az új blogbejegyzéseinkről rendszeresen e-mailben értesülhet.