Was ist homoskedastisch?
Homoskedastisch (auch "homoskedastisch" geschrieben) bezieht sich auf eine Bedingung, bei der die Varianz des Residuums oder Fehlerterms in einem Regressionsmodell konstant ist. Das heißt, der Fehlerterm ändert sich nicht stark, wenn sich der Wert der Prädiktorvariablen ändert. Das Fehlen einer Homoskedastizität kann jedoch darauf hindeuten, dass das Regressionsmodell möglicherweise zusätzliche Prädiktorvariablen enthalten muss, um die Leistung der abhängigen Variablen zu erklären.
Die zentralen Thesen
- Homoskedastizität tritt auf, wenn die Varianz des Fehlerterms in einem Regressionsmodell konstant ist. Wenn die Varianz des Fehlerterms homoskedastisch ist, war das Modell gut definiert. Bei zu großer Varianz ist das Modell möglicherweise nicht gut definiert. Das Hinzufügen zusätzlicher Prädiktorvariablen kann helfen, die Leistung der abhängigen Variablen zu erklären. Eine Heteroskedastizität tritt natürlich auf, wenn die Varianz des Fehlerterms nicht konstant ist.
So funktioniert Homoskedastic
Homoskedastizität ist eine Annahme der linearen Regressionsmodellierung. Wenn die Varianz der Fehler um die Regressionslinie stark variiert, ist das Regressionsmodell möglicherweise schlecht definiert. Das Gegenteil von Homoskedastizität ist Heteroskedastizität, ebenso wie das Gegenteil von "homogen" "heterogen" ist. Die Heteroskedastizität (auch „Heteroskedastizität“ genannt) bezieht sich auf eine Bedingung, bei der die Varianz des Fehlerterms in einer Regressionsgleichung nicht konstant ist.
Wenn berücksichtigt wird, dass die Varianz die gemessene Differenz zwischen dem prognostizierten Ergebnis und dem tatsächlichen Ergebnis einer bestimmten Situation ist, kann die Bestimmung der Homoskedastizität dazu beitragen, zu bestimmen, welche Faktoren für die Genauigkeit angepasst werden müssen.
Besondere Überlegungen
Ein einfaches Regressionsmodell oder eine Gleichung besteht aus vier Begriffen. Auf der linken Seite befindet sich die abhängige Variable. Es repräsentiert das Phänomen, das das Modell "erklären" möchte. Auf der rechten Seite befinden sich eine Konstante, eine Prädiktorvariable und ein Rest- oder Fehlerausdruck. Der Fehlerterm zeigt den Variabilitätsbetrag in der abhängigen Variablen an, der nicht durch die Prädiktorvariable erklärt wird.
Beispiel für Homoskedastic
Angenommen, Sie möchten die Testergebnisse der Schüler anhand der Zeit erklären, die jeder Schüler mit dem Lernen verbracht hat. In diesem Fall wären die Testergebnisse die abhängige Variable und die für das Studium aufgewendete Zeit die Prädiktorvariable.
Der Fehlerbegriff würde den Betrag der Varianz in den Testergebnissen anzeigen, der nicht durch den Zeitaufwand für das Lernen erklärt wurde. Wenn diese Varianz einheitlich oder homoskedastisch ist, könnte dies darauf hindeuten, dass das Modell eine angemessene Erklärung für die Testleistung darstellt - und dies in Form der für das Studium aufgewendeten Zeit erklärt.
Die Varianz kann jedoch heteroskedastisch sein. Eine grafische Darstellung der Fehlerdaten kann zeigen, dass eine große Menge an Studienzeit sehr genau mit hohen Testergebnissen korrespondiert, dass jedoch die Testergebnisse bei niedriger Studienzeit stark variierten und sogar einige sehr hohe Ergebnisse enthielten. Die Varianz der Ergebnisse lässt sich also nicht einfach durch eine Prädiktorvariable erklären - die Zeit, die zum Lernen benötigt wird. In diesem Fall ist wahrscheinlich ein anderer Faktor am Werk, und das Modell muss möglicherweise erweitert werden, um es oder sie zu identifizieren. Weitere Untersuchungen könnten ergeben, dass einige Schüler die Antworten auf den Test bereits im Voraus gesehen hatten oder zuvor einen ähnlichen Test absolviert hatten und daher nicht für diesen speziellen Test lernen mussten.
Um das Regressionsmodell zu verbessern, würde der Forscher daher eine weitere erklärende Variable hinzufügen, die angibt, ob ein Student die Antworten vor dem Test gesehen hat. Das Regressionsmodell hätte dann zwei erklärende Variablen - Zeitstudium und ob der Student die Antworten vorher gekannt hat. Mit diesen beiden Variablen würde mehr von der Varianz der Testergebnisse erklärt und die Varianz des Fehlerterms könnte dann homoskedastisch sein, was darauf hindeutet, dass das Modell gut definiert ist.