Was ist zufällige Korrelation?
In der Statistik bezieht sich eine falsche Korrelation oder Falschheit auf eine Verbindung zwischen zwei Variablen, die kausal erscheint, aber nicht ist. Scheinbeziehungen haben oft das Aussehen einer Variablen, die eine andere beeinflusst. Diese falsche Korrelation wird häufig durch einen dritten Faktor verursacht, der zum Zeitpunkt der Untersuchung nicht ersichtlich ist und manchmal als Störfaktor bezeichnet wird.
Die zentralen Thesen
- Scheinkorrelation oder Falschheit ist, wenn zwei Faktoren zufällig zusammenhängen, dies jedoch nicht. Das Auftreten eines Kausalzusammenhangs ist häufig auf ähnliche Bewegungen in einem Diagramm zurückzuführen, die sich als zufällig herausstellen oder durch einen dritten "verwirrenden" Faktor verursacht werden. Scheinkorrelation kann häufig durch kleine Stichprobengrößen oder willkürliche Endpunkte verursacht werden.
Wie fehlerhafte Korrelation funktioniert
Wenn sich zwei Zufallsvariablen in einem Diagramm genau verfolgen, kann man leicht eine Korrelation oder eine Beziehung zwischen den beiden Faktoren vermuten, wenn sich eine Änderung auf den anderen auswirkt. Abgesehen von "Kausalität", einem anderen Thema, kann diese Beobachtung den Leser der Tabelle zu der Annahme verleiten, dass die Bewegung von Variable A mit der Bewegung in Variable B zusammenhängt oder umgekehrt. Bei genauerer statistischer Betrachtung sind die ausgerichteten Bewegungen jedoch manchmal zufällig oder werden durch einen dritten Faktor verursacht, der die ersten beiden beeinflusst. Dies ist eine falsche Korrelation. Untersuchungen, die mit kleinen Stichprobengrößen oder willkürlichen Endpunkten durchgeführt werden, sind von Ungenauigkeiten betroffen.
Beispiel für zufällige Korrelationen
Es ist nicht allzu schwierig, interessante Zusammenhänge zu entdecken. Viele werden sich jedoch als falsch herausstellen. Für die männlichen Arten an der Wall Street betreffen zwei beliebte falsche Korrelationen Frauen und Sport. Aus den 1920er Jahren stammt die Rocklängentheorie, die besagt, dass Rocklängen und Börsenrichtung korrelieren. Wenn die Rocklängen lang sind, bedeutet dies, dass die Börse sinkt. Wenn sie knapp sind, steigt der Markt. Gegen Ende Januar wird über den sogenannten Super Bowl-Indikator gesprochen, der darauf hindeutet, dass ein Sieg des AFC-Teams wahrscheinlich einen Rückgang der Aktienmärkte im kommenden Jahr zur Folge hat, während ein Sieg des NFC-Teams auf einen Anstieg des AFC-Marktes hindeutet Markt. Seit 1966 hat der Indikator eine Genauigkeitsrate von 80%. Es ist ein lustiger Gesprächsstoff, aber wahrscheinlich nicht etwas, das ein seriöser Finanzberater als Anlagestrategie für Kunden empfehlen würde.
Hier einige weitere Beispiele für häufig vorkommende falsche Korrelationen:
- Ertrinken steigt, wenn der Eisverkauf steigt. Es mag den Anschein erwecken, als würden die Eisverkäufe zu mehr Ertrinken führen. In Wirklichkeit kann jedoch die steigende Hitze dazu führen, dass mehr Menschen schwimmen und mehr Eis kaufen Führungskräfte, die bitte und danke sagen, genießen häufiger eine bessere Leistung. Personen, die Team-Ausrüstung von Oakland Raiders tragen, begehen mit größerer Wahrscheinlichkeit Straftaten.
Wie man störende Korrelationen erkennt
Statistiker und andere Wissenschaftler, die Daten analysieren, müssen ständig nach falschen Beziehungen Ausschau halten. Es gibt zahlreiche Methoden, die sie verwenden, darunter:
- Gewährleistung einer geeigneten repräsentativen Stichprobe. Erzielung einer angemessenen Stichprobengröße. Vorsicht bei willkürlichen Endpunkten. Kontrolle möglichst vieler externer Variablen. Verwendung einer Nullhypothese und Überprüfung auf einen starken p-Wert.