Was ist schrittweise Regression?
Die Regressionsanalyse ist ein weit verbreiteter statistischer Ansatz, mit dem Beziehungen zwischen Variablen identifiziert werden sollen. Die Idee ist, relevante Daten zu bündeln, um fundiertere Entscheidungen zu treffen. Dies ist in der Welt des Investierens eine gängige Praxis. Die schrittweise Regression ist die schrittweise iterative Konstruktion eines Regressionsmodells, bei der unabhängige Variablen automatisch ausgewählt werden. Die Verfügbarkeit statistischer Softwarepakete ermöglicht eine schrittweise Regression, selbst in Modellen mit Hunderten von Variablen.
Arten der schrittweisen Regression
Das zugrunde liegende Ziel der schrittweisen Regression besteht darin, durch eine Reihe von Tests (F-Tests, t-Tests) einen Satz unabhängiger Variablen zu finden, die die abhängige Variable signifikant beeinflussen. Dies geschieht mit Computern durch Iteration, dh durch wiederholte Runden oder Zyklen von Analysen, um zu Ergebnissen oder Entscheidungen zu gelangen. Die automatische Durchführung von Tests mit Hilfe statistischer Softwarepakete hat den Vorteil, Zeit für den Einzelnen zu sparen.
Die zentralen Thesen
- Bei der Regressionsanalyse handelt es sich um einen statistischen Ansatz, mit dem die Beziehungen zwischen unabhängigen und abhängigen Variablen verstanden und gemessen werden sollen. Bei der schrittweisen Regression wird die statistische Signifikanz jeder unabhängigen Variablen im Modell untersucht. Bei der Vorauswahl wird eine Variable hinzugefügt und anschließend die statistische Signifikanz überprüft Die Methode der Rückwärtseliminierung beginnt mit einem Modell, das mit vielen Variablen geladen ist, und entfernt dann eine Variable, um ihre Bedeutung im Verhältnis zu den Gesamtergebnissen zu testen. Die schrittweise Regression hat viele Kritikpunkte, da sie Daten in ein Modell einfügt, um das gewünschte Ergebnis zu erzielen.
Eine schrittweise Regression kann erreicht werden, indem jeweils eine unabhängige Variable ausprobiert und in das Regressionsmodell aufgenommen wird, wenn sie statistisch signifikant ist, oder indem alle potenziellen unabhängigen Variablen in das Modell aufgenommen und diejenigen eliminiert werden, die statistisch nicht signifikant sind. Einige verwenden eine Kombination beider Methoden, und daher gibt es drei Ansätze zur schrittweisen Regression:
- Die Vorauswahl beginnt ohne Variablen im Modell, testet jede Variable beim Hinzufügen zum Modell und behält dann die statistisch wichtigsten Variablen bei - und wiederholt den Vorgang, bis die Ergebnisse optimal sind. Die Ausscheidung nach hinten beginnt mit einer Reihe unabhängiger Variablen. Löschen Sie jeweils eine Variable und testen Sie dann, ob die entfernte Variable statistisch signifikant ist. Die bidirektionale Eliminierung ist eine Kombination der ersten beiden Methoden, mit denen geprüft wird, welche Variablen einbezogen oder ausgeschlossen werden sollen.
Ein Beispiel für eine schrittweise Regression unter Verwendung der Rückwärtseliminierungsmethode wäre der Versuch, den Energieverbrauch in einer Fabrik unter Verwendung von Variablen wie Betriebszeit der Ausrüstung, Alter der Ausrüstung, Mitarbeitergröße, Außentemperaturen und Jahreszeit zu verstehen. Das Modell enthält alle Variablen. Anschließend wird jede Variable einzeln entfernt, um festzustellen, welche statistisch am wenigsten signifikant ist. Am Ende könnte das Modell zeigen, dass die Jahreszeit und die Temperaturen am bedeutendsten sind, was möglicherweise darauf hindeutet, dass der maximale Energieverbrauch in der Fabrik bei maximaler Nutzung der Klimaanlage liegt.
Einschränkungen der schrittweisen Regression
Sowohl lineare als auch multivariate Regressionsanalysen sind in der heutigen Investmentwelt weit verbreitet. Die Idee ist oft, Muster zu finden, die in der Vergangenheit existierten und die auch in Zukunft wiederkehren könnten. Eine einfache lineare Regression könnte beispielsweise die Preis-Gewinn-Verhältnisse und die Aktienrenditen über viele Jahre untersuchen, um festzustellen, ob Aktien mit einem niedrigen KGV (unabhängige Variable) höhere Renditen bieten (abhängige Variable). Das Problem bei diesem Ansatz ist, dass sich die Marktbedingungen häufig ändern und die Beziehungen, die in der Vergangenheit bestanden, nicht unbedingt für die Gegenwart oder die Zukunft gelten.
In der Zwischenzeit hat der schrittweise Regressionsprozess viele Kritiker und es gibt sogar Aufrufe, die Methode überhaupt nicht mehr anzuwenden. Statistiker stellen verschiedene Nachteile des Ansatzes fest, einschließlich falscher Ergebnisse, einer inhärenten Verzerrung des Prozesses selbst und der Notwendigkeit einer signifikanten Rechenleistung, um komplexe Regressionsmodelle durch Iteration zu entwickeln.