Mégis, mi a normális? Egy illúzió.

  • Debreczeni Csaba Szerző:
  • Közzétéve:
     Olvasási idő: 11 perc   

“Statisticians are not usually very adventurous people, perhaps because they are more interested in means than extremes.”

J.B.S. Haldane. Some Statistical Adventures, 1957 Essay.

Valószínűleg már sokan találkoztak az alábbi ábrával:

Ez az ábra a normál eloszlást tükrözi. Most az a javaslatom, hogy ha pénzügyekről, gazdasági adatokról, vagyoni eloszlásról, társadalmi kérdésekről van szó, akkor ezt felejtsük el egyszer és mindenkorra. És mindent, ami ezzel együtt jár, mint például átlag vagy szórás, így kevesebb meglepetés érhet minket. De nézzük meg közelebbről.

A fenti, normál eloszlás alapján az adatainkat az átlag és a szórás megfelelően jellemzi. Azaz az adatok 68%-a az átlagtól +/-1 szórásnyira fog elhelyezkedni. Ez látható az ábrán is. Példával szemléltetve, ha az emberek magasságáról beszélünk, akkor Magyarországon a férfiak átlagmagassága 176 cm és a szórása 7,4 cm. Ez alapján a férfiak 68%-a 168,6 és 183,4 cm közötti (176cm +/-7,4 cm), 95%-uk 161,2 és 190,8 közötti, míg 99,7%-uk, azaz majdnem minden felnőtt férfi az országban 153,8 és 198,5 cm között található. Ettől alacsonyabb vagy magasabb személy van, de elvétve, az esetek 0,3%-ában.

A normál eloszlású minták egyik jellemzője, hogy egy szélsőséges adat nem változtat jelentősen a minta jellemzőin, például az átlagon vagy a szóráson. Azaz, ha találkozunk egy 220 centis emberrel, ő nem fogja az adatokat (az átlagot vagy a szórást) torzítani. A normál eloszlás tökéletesen használható például a fent említett magasságok vagy súly esetében, egy teszten elért pontok jellemzésére, esetleg vérnyomás vizsgálatánál, vagy napi kalória bevitelnél.

És aztán jöttek a közgazdászok és azt mondták, hogy a normál eloszlás nagyjából a pénzügyekre is megfeleltethető. Ez egy óriási csúsztatás. Ha egy közgazdász átlagról és szórásról kezd el beszélni, akkor érdemes kétségeinknek hangot adni – mondják sokan, akik tényleg értik az eloszlásokat, nem csak megtanulták. Ahogy Yogi Berra mondta: „Az elméletben nincs különbség az elmélet és a gyakorlat között. A gyakorlatban van.” De nézzük, hogy mi is a baj.

A modern pénzügyi elméletek, legyen szó Markowitz portfólió-elméletéről, a Black-Scholes opcióárazási modellről, a Sharpe-rátáról (lehetne sorolni napestig) mind abból a feltételezésből indulnak ki, hogy a piacok normál eloszlásúak. Abba már bele sem megyek, hogy mellette olyan mesterséges világot kreálnak, mint hogy nincsenek adók, a likviditás mindig adott, bármikor bármit eladhatok, megvehetek, ami egész egyszerűen nem igaz és még bizonyítani sem kell, csak ki kell lépni a való életbe, kereskedésbe. Ezt mondjuk néhány Nobel-díjas elméleti szakember megtette a kilencvenes évek végén és az addig számon tartott legnagyobb csődöt idézték elő, ez volt az LTCM (Long-Term Capital Management) kudarca.

Nézzük ezt a normál eloszlást a piacokra. Már csak azért is érdekes, mert a koronavírus miatti piaci mozgások nem normálisak, mondják a befektetők. Tényleg nem normálisak?

Forrás: Bloomberg, Danube Capital

Az alábbi ábrán az látható, hogy az általunk vizsgált 32 db tőzsdeindex 2015 és 2020 közötti hozama a normális eloszlást feltételezve milyen értékeket vett fel. Azaz a bevezető ábra alapján az „X” tengelyen az látható, hogy az hány szórásra tér el az átlagtól. Ezt hívjuk normalizálásnak, de ennek technikai háttere most teljesen lényegtelen. Az a lényeg, hogy lássuk az adatok 99,7%-a tényleg beleesik-e a fent említett +/- 3 szórás határba.

Ahogy látható, ez nem normál eloszlás. Mind a pozitív, mind a negatív tartomány tele van +3 szórásnál magasabb és -3 szórásnál alacsonyabb értékekkel. Ezek pirossal vannak jelölve, és meg is vannak nagyítva, különben nagyon alacsony lenne az oszlopdiagram és láthatatlan lenne. A normál eloszlás világában olyan esetek, amelyek átlagtól több, mint +/-3 szórásnyira jelenik meg, megtörténhetnek, de nagyon ritkán. Helyette az ábrán záporoznak a -10, -8, +5, +7 stb. szórásnyi eltérések. Már az ábra felülír mindent, ami a pénzügyi modellezésről szól. A hozamok nem normál eloszlásúak. Teljesen más eloszlás jellemzi őket.

Ha kiválasztunk egy másik eloszlást, amely formája szintén haranggörbe; azaz majdnem ugyanúgy néz ki, mint a cikk első ábrája; de a végeken, azaz a nagy eltéréseknél „megengedőbb” (például ilyen a T-eloszlás), akkor bizonyos esetek előfordulása máris máshogyan fest. A táblázat azt mutatja meg, hogy 1 és 10 szórás között, legyen + vagy -, mekkora eséllyel láthatunk adatot.

+/-10 szórásnyi esemény a normál eloszlásnál értelmezhetetlen, a T-eloszlás esetében 101 naponta (!) előfordulhat. Ha a normál eloszlást használjuk a kockázat modellezésére, akkor masszívan alul fogjuk becsülni a katasztrofális eseményeket. És ez nem csak a pénzügyekre, hanem természeti katasztrófákra, szociális eseményekre is igaz. Azt fogjuk gondolni, hogy például az S&P500 piacán szinte alig lehetséges egy 8-10%-os elmozdulás, miközben az akár évente is megtörténhet. Egy 5 szórásnyi esemény a normál eloszlás szerint 1,744,278 naponta, azaz 6900 évente fordulhatna elő. Most pedig számoljuk meg, hogy a második ábrán hány érték van + vagy -5 felett és alatt.

Forrás: Danube Capital

Normál eloszlást feltételezve a leíró statisztika is félrevezet minket. Egy olyan eloszlás esetén, ahol a kiugró értékek lehetségesek; sem az átlag, sem a szórás nem mond nekünk semmit. Az átlaggal jól leírhatjuk a sokaságot, de ha nem a normál eloszlás világában élünk, akkor az csak félrevezet minket – már ha egyáltalán létezik. Erre tipikus példaként szokták mondani, hogy ha egy focimeccsen hirtelen megjelenik Bill Gates, akkor a stadionban, átlagban minden jelenlévő néző vagyona 1-1,5 millió dollárral emelkedik.

Az alábbi ábra ezt mutatja meg a normál eloszlás és a fent már említett T-eloszlás esetében. Sőt hozunk egy másik eloszlást, a Pareto-eloszlást[1]. A normál eloszlás esetében az átlag gyorsan olyan értéket vesz fel, amellyel jól jellemezhető a sokaság, a második esetében már többször ugrás tapasztalható. Ahogy az ábrán is látszik, normál eloszlás átlaga 2500-3000 lépés után nagyjából jól jellemzi a sokaságot, a T-eloszlás esetén még a 9000. lépésnél is van egy letörés az átlagban, azaz az egyáltalán nem stabil. Mégis, melyiket használjam?! Az átlagot tehát az fogja meghatározni, hogy a mintavételem honnan származik.

Ha részvénypiaci példánál maradunk és a lenti ábrán lévő adatok a hozam átlagai és a vizsgált részvény múltja legyen 4500 nap, akkor az átlagom a T-eloszlás alapján picit 0 felett lesz, hiszen kb. a 4500. napon ennyit mutat a sötét vonaldiagram. Ezzel fogok dolgozni. És ahogy telik az idő látszik, hogy ez egy „hibás” adat, hiszen az átlag innen folyamatosan csökken. Bármit is fogok feltételezni a modellben, az téves eredményre fog vezetni (a számok abszolút mértéke most nem számít, csak szemléltetésként használjuk ezeket az adatokat).

Forrás: Danube Capital

És most nézzük az ennél durvább eloszlást, a Paretot. Itt meg aztán végképp félrevezet mindenkit a leíró statisztika. Sok esetben fogalmunk sincs, mi az igazi átlag, ami a sokaságot jellemzi. Tipikus példája a fent említett Bill Gates-es példának, amíg ő meg nem jelenik, teljesen más az összegyűltek vagyonának átlaga. Egy ilyen eloszlást vagy mondjuk inkább eseményt az extrém értékek fogják meghatározni.

Forrás: Danube Capital

És akkor most nézzük meg az USA munkanélküliségi segélyért folyamodók számát heti bontásban. A két héttel ezelőtti adat egy 18 szigmás elmozdulás volt, a múlt heti pedig 39.

Forrás: St. Louis Fed, Danube Capital

A legnagyobb érv a normális eloszlás használata mellett az, hogy azért azok nagyrészt működnek, van 10 vagy 20 évente egy-egy eset, amikor nem. És pont ez a legnagyobb gyengesége is: ki akar egy olyan rendszerben élni, egy olyan piacon kereskedni, ami 10-20 évente összeomlik és mindent újra kell építeni? Azt hiszem ezzel fejeződött be ennek a cikknek az előzménye is. Azt gondolom itt az idő, hogy kicsit távolodjunk a „mainstream” megoldásoktól; persze tudom, hogy minden döntésben a legjobb felelősségbiztosítás a szokásos, már bevett logika használata.

Utóirat: visszatérve a kiemelt képre, nem, a koronavírus járvány nem fekete hattyú.


[1]A Pareto-elv a Pareto eloszlás egyik speciális esete, amely más néven a “80-20-as szabály”. Ez azt mondja ki, hogy a lakosság 20%-a birtokolja a vagyon 80%-át. De nem csak vagyoni eloszlásra lehet használni, hanem például egy országban a földterületek birtoklására, vagy a városok-falvak lakosságára is. 

Szeretne hasonló cikkekről folyamatosan értesülni?

  • Engedélyezze a böngésző általi weboldal-értesítéseket, így az új blogbejegyzéseinkről azonnal értesülhet.
  • Iratkozzon fel hírlevelünkre ezen a linken, így az új blogbejegyzéseinkről havonta, e-mailben értesülhet.