Was ist Multikollinearität?
Multikollinearität ist das Auftreten hoher Wechselbeziehungen zwischen unabhängigen Variablen in einem multiplen Regressionsmodell. Multikollinearität kann zu verzerrten oder irreführenden Ergebnissen führen, wenn ein Forscher oder Analyst versucht, zu bestimmen, wie gut jede unabhängige Variable am effektivsten zum Vorhersagen oder Verstehen der abhängigen Variablen in einem statistischen Modell verwendet werden kann. Im Allgemeinen kann Multikollinearität zu größeren Konfidenzintervallen und weniger zuverlässigen Wahrscheinlichkeitswerten für die unabhängigen Variablen führen. Das heißt, die statistischen Schlussfolgerungen aus einem Modell mit Multikollinearität sind möglicherweise nicht zuverlässig.
Multikollinearität verstehen
Statistische Analysten verwenden mehrere Regressionsmodelle, um den Wert einer bestimmten abhängigen Variablen basierend auf den Werten von zwei oder mehr unabhängigen Variablen vorherzusagen. Die abhängige Variable wird manchmal als Ergebnis-, Ziel- oder Kriterienvariable bezeichnet. Ein Beispiel ist ein multivariates Regressionsmodell, bei dem versucht wird, die Aktienrendite anhand von Faktoren wie Preis-Gewinn-Verhältnis, Marktkapitalisierung, vergangene Performance oder anderen Daten zu antizipieren. Die Aktienrendite ist die abhängige Variable und die verschiedenen Bits der Finanzdaten sind die unabhängigen Variablen.
Die zentralen Thesen
- Multikollinearität ist ein statistisches Konzept, bei dem unabhängige Variablen in einem Modell korreliert werden. Multikollinearität zwischen unabhängigen Variablen führt zu weniger zuverlässigen statistischen Schlussfolgerungen. Es ist besser, unabhängige Variablen zu verwenden, die nicht korreliert sind oder sich wiederholen, wenn mehrere Regressionsmodelle erstellt werden, die zwei oder mehr Variablen verwenden.
Multikollinearität in einem multiplen Regressionsmodell zeigt an, dass kollineare unabhängige Variablen in gewisser Weise zusammenhängen, obwohl die Beziehung möglicherweise zufällig ist oder nicht. Beispielsweise könnte die Wertentwicklung in der Vergangenheit mit der Marktkapitalisierung zusammenhängen, da Aktien, die sich in der Vergangenheit gut entwickelt haben, steigende Marktwerte aufweisen werden. Mit anderen Worten, Multikollinearität kann existieren, wenn zwei unabhängige Variablen stark korreliert sind. Dies kann auch passieren, wenn eine unabhängige Variable aus anderen Variablen im Datensatz berechnet wird oder wenn zwei unabhängige Variablen ähnliche und sich wiederholende Ergebnisse liefern.
Eine der häufigsten Möglichkeiten, das Problem der Multikollinearität zu beseitigen, besteht darin, zunächst kollineare unabhängige Variablen zu identifizieren und dann alle bis auf eine zu entfernen. Es ist auch möglich, Multikollinearität zu eliminieren, indem zwei oder mehr kollineare Variablen zu einer einzigen Variablen kombiniert werden. Eine statistische Analyse kann dann durchgeführt werden, um die Beziehung zwischen der angegebenen abhängigen Variablen und nur einer einzelnen unabhängigen Variablen zu untersuchen.
Beispiel für Multikollinearität
Beim Investieren ist Multikollinearität eine gängige Überlegung, wenn eine technische Analyse durchgeführt wird, um wahrscheinliche zukünftige Kursbewegungen eines Wertpapiers, z. B. einer Aktie oder eines Warentermins, vorherzusagen. Marktanalysten möchten es vermeiden, technische Indikatoren zu verwenden, die insofern kollinear sind, als sie auf sehr ähnlichen oder verwandten Inputs basieren. Sie tendieren dazu, ähnliche Vorhersagen in Bezug auf die abhängige Variable der Preisbewegung zu machen. Stattdessen muss die Marktanalyse auf deutlich unterschiedlichen unabhängigen Variablen basieren, um sicherzustellen, dass sie den Markt unter verschiedenen unabhängigen analytischen Gesichtspunkten analysiert.
Der bekannte technische Analyst John Bollinger, Schöpfer des Indikators Bollinger Bands, merkt an, dass "eine Grundregel für den erfolgreichen Einsatz der technischen Analyse die Vermeidung von Multikollinearität inmitten von Indikatoren erfordert".
Analysten vermeiden es, zwei oder mehr technische Indikatoren desselben Typs zu verwenden, um das Problem zu lösen. Stattdessen analysieren sie ein Wertpapier mit einem bestimmten Indikatortyp, z. B. einem Momentumindikator, und führen dann eine separate Analyse mit einem anderen Indikatortyp, z. B. einem Trendindikator, durch.
Ein Beispiel für ein potenzielles Multikollinearitätsproblem ist die Durchführung einer technischen Analyse unter Verwendung mehrerer ähnlicher Indikatoren wie Stochastik, relativer Stärkeindex (RSI) und Williams% R, die allesamt Momentumindikatoren sind, die auf ähnlichen Inputs beruhen und wahrscheinlich ähnliche Ergebnisse erzielen Ergebnisse. In diesem Fall ist es besser, alle Indikatoren bis auf einen zu entfernen oder mehrere zu einem einzigen Indikator zusammenzufassen und gleichzeitig einen Trendindikator hinzuzufügen, der wahrscheinlich nicht in hohem Maße mit dem Momentumindikator korreliert.