Was ist Sample Selection Bias?
Ein Stichprobenauswahlfehler ist eine Art von Fehler, der durch die Auswahl nicht zufälliger Daten für die statistische Analyse verursacht wird. Die Verzerrung besteht aufgrund eines Fehlers im Stichprobenauswahlprozess, bei dem eine Teilmenge der Daten aufgrund eines bestimmten Attributs systematisch ausgeschlossen wird. Der Ausschluss der Teilmenge kann die statistische Signifikanz des Tests beeinflussen oder zu verzerrten Ergebnissen führen.
Grundlegendes zum Sample Selection Bias
Die Überlebensverzerrung ist eine übliche Art der Stichprobenauswahlverzerrung. Beispielsweise kann es beim Backtesting einer Anlagestrategie für eine große Gruppe von Aktien zweckmäßig sein, nach Wertpapieren zu suchen, die Daten für den gesamten Stichprobenzeitraum enthalten. Wenn wir die Strategie anhand von Bestandsdaten für einen Zeitraum von 15 Jahren testen würden, könnten wir nach Beständen suchen, die vollständige Informationen für den gesamten Zeitraum von 15 Jahren enthalten. Die Eliminierung einer Aktie, die den Handel einstellte oder den Markt kurzzeitig verließ, würde jedoch zu einer Verzerrung in unserer Datenstichprobe führen. Da wir nur Aktien mit einer Laufzeit von 15 Jahren berücksichtigen, wären unsere Endergebnisse fehlerhaft, da diese sich gut genug entwickelten, um den Markt zu überstehen.
Hedge-Fonds-Leistungsindizes sind ein Beispiel für eine Verzerrung der Stichprobenauswahl, die der Verzerrung der Überlebensrate unterliegt. Da Hedge-Fonds, die nicht überleben, ihre Wertentwicklung nicht mehr an Indexaggregatoren weitergeben, sind die resultierenden Indizes naturgemäß auf verbleibende Fonds und Strategien ausgerichtet, sodass sie überleben.
Analysten können sich anpassen, um diesen Verzerrungen Rechnung zu tragen, sie können jedoch Verzerrungen in den Prozess einführen.