Was ist ein Varianzinflationsfaktor?
Varianzinflation f Der Varianzinflationsfaktor (VIF) ist ein Maß für den Betrag der Multikollinearität in einer Reihe mehrerer Regressionsvariablen. Mathematisch ist die VIF für eine Regressionsmodellvariable gleich dem Verhältnis der Gesamtmodellvarianz zur Varianz eines Modells, das nur diese einzelne unabhängige Variable enthält. Dieses Verhältnis wird für jede unabhängige Variable berechnet. Ein hohes VIF zeigt an, dass die zugehörige unabhängige Variable mit den anderen Variablen im Modell stark kollinear ist.
Die zentralen Thesen
- Ein Varianzinflationsfaktor (VIF) liefert ein Maß für die Multikollinearität unter den unabhängigen Variablen in einem multiplen Regressionsmodell. Das Erkennen der Multikollinearität ist wichtig, da die Erklärungskraft des Modells zwar nicht verringert wird, die statistische Signifikanz der unabhängigen Variablen jedoch verringert wird. Ein großes VIF für eine unabhängige Variable zeigt eine stark kollineare Beziehung zu den anderen Variablen an, die in der Struktur des Modells und der Auswahl unabhängiger Variablen berücksichtigt oder angepasst werden sollten.
Verständnis eines Varianzinflationsfaktors
Eine multiple Regression wird verwendet, wenn eine Person die Wirkung mehrerer Variablen auf ein bestimmtes Ergebnis testen möchte. Die abhängige Variable ist das Ergebnis, auf das die unabhängigen Variablen, die die Eingaben in das Modell sind, einwirken. Multikollinearität liegt vor, wenn zwischen einer oder mehreren der unabhängigen Variablen oder Eingaben eine lineare Beziehung oder Korrelation besteht. Multikollinearität schafft ein Problem bei der multiplen Regression, da die Eingaben sich gegenseitig beeinflussen und nicht wirklich unabhängig sind und es schwierig ist zu testen, inwieweit sich die Kombination der unabhängigen Variablen auf die abhängige Variable oder das Ergebnis innerhalb des Regressionsmodells auswirkt. Statistisch gesehen erschwert ein multiples Regressionsmodell mit hoher Multikollinearität die Schätzung der Beziehung zwischen jeder der unabhängigen Variablen und der abhängigen Variablen. Kleine Änderungen der verwendeten Daten oder der Struktur der Modellgleichung können große und unberechenbare Änderungen der geschätzten Koeffizienten für die unabhängigen Variablen hervorrufen.
Um sicherzustellen, dass das Modell ordnungsgemäß spezifiziert ist und ordnungsgemäß funktioniert, gibt es Tests, die auf Multikollinearität getestet werden können. Varianzinflationsfaktor ist ein solches Messinstrument. Mithilfe von Varianzinflationsfaktoren können Sie den Schweregrad von Multikollinearitätsproblemen ermitteln, sodass das Modell angepasst werden kann. Der Varianzinflationsfaktor misst, wie stark das Verhalten (Varianz) einer unabhängigen Variablen durch ihre Wechselwirkung / Korrelation mit den anderen unabhängigen Variablen beeinflusst oder aufgeblasen wird. Varianzinflationsfaktoren ermöglichen ein schnelles Maß dafür, wie viel eine Variable zum Standardfehler in der Regression beiträgt. Wenn signifikante Multikollinearitätsprobleme vorliegen, ist der Varianzinflationsfaktor für die beteiligten Variablen sehr groß. Nachdem diese Variablen identifiziert wurden, können verschiedene Ansätze zum Eliminieren oder Kombinieren kollinearer Variablen verwendet werden, um das Problem der Multikollinearität zu lösen.
Während Multikollinearität die gesamte Vorhersagekraft eines Modells nicht verringert, kann sie Schätzungen der Regressionskoeffizienten liefern, die statistisch nicht signifikant sind. In gewissem Sinne kann dies als eine Art Doppelzählung im Modell angesehen werden. Wenn zwei oder mehr unabhängige Variablen eng miteinander verwandt sind oder fast dasselbe messen, wird der zugrunde liegende Effekt, den sie messen, über die Variablen doppelt (oder mehrmals) berücksichtigt, und es wird schwierig oder unmöglich zu sagen, welche Variable die Variable tatsächlich beeinflusst unabhängige Variable. Dies ist ein Problem, da das Ziel vieler ökonometrischer Modelle darin besteht, genau diese Art statistischer Beziehung zwischen den unabhängigen Variablen und der abhängigen Variablen zu testen.
Zum Beispiel, wenn ein Ökonom testen möchte, ob ein statistisch signifikanter Zusammenhang zwischen der Arbeitslosenquote (als unabhängige Variable) und der Inflationsrate (als abhängige Variable) besteht. Die Einbeziehung zusätzlicher unabhängiger Variablen, die sich auf die Arbeitslosenquote beziehen, wie beispielsweise neue Erstanträge auf Arbeitslosenunterstützung, würde wahrscheinlich Multikollinearität in das Modell einführen. Das Gesamtmodell weist möglicherweise eine starke statistisch ausreichende Aussagekraft auf, kann jedoch nicht feststellen, ob der Effekt hauptsächlich auf die Arbeitslosenquote oder auf die neuen Erstanträge auf Arbeitslosenunterstützung zurückzuführen ist. Dies würde das VIF erkennen und es würde vorschlagen, möglicherweise eine der Variablen aus dem Modell zu streichen oder einen Weg zu finden, sie zu konsolidieren, um ihre gemeinsame Wirkung zu erfassen, je nachdem, welche spezifische Hypothese der Forscher testen möchte.