Was ist Varianzanalyse (ANOVA)?
Die Varianzanalyse (ANOVA) ist ein Analysewerkzeug, das in Statistiken verwendet wird und eine beobachtete aggregierte Variabilität, die in einem Datensatz gefunden wird, in zwei Teile aufteilt: systematische Faktoren und zufällige Faktoren. Die systematischen Faktoren haben statistischen Einfluss auf den gegebenen Datensatz, die Zufallsfaktoren nicht. Analysten verwenden den ANOVA-Test, um den Einfluss unabhängiger Variablen auf die abhängige Variable in einer Regressionsstudie zu bestimmen.
Die im 20. Jahrhundert entwickelten t- und z-Testmethoden wurden bis 1918 für statistische Analysen verwendet, als Ronald Fisher die Varianzanalyse-Methode entwickelte. ANOVA wird auch als Fisher-Varianzanalyse bezeichnet und ist die Erweiterung der t- und z-Tests. Der Begriff wurde 1925 bekannt, nachdem er in Fishers Buch "Statistical Methods for Research Workers" veröffentlicht wurde. Es wurde in der experimentellen Psychologie eingesetzt und später auf komplexere Fächer ausgeweitet.
Die Formel für ANOVA lautet:
Um die Umstellung zu erleichtern, müssen Sie F = MSEMST Wobei: F = ANOVA-KoeffizientMST = Mittlere Summe der Quadrate aufgrund der BehandlungMSE = Mittlere Summe der Quadrate aufgrund von Fehlern
Was zeigt die Varianzanalyse?
Der ANOVA-Test ist der erste Schritt bei der Analyse von Faktoren, die sich auf einen bestimmten Datensatz auswirken. Nach Abschluss des Tests führt ein Analyst zusätzliche Tests zu den methodischen Faktoren durch, die messbar zur Inkonsistenz des Datensatzes beitragen. Der Analyst verwendet die ANOVA-Testergebnisse in einem f-Test, um zusätzliche Daten zu generieren, die mit den vorgeschlagenen Regressionsmodellen übereinstimmen.
Der ANOVA-Test ermöglicht den gleichzeitigen Vergleich von mehr als zwei Gruppen, um festzustellen, ob eine Beziehung zwischen ihnen besteht. Das Ergebnis der ANOVA-Formel, die F-Statistik (auch als F-Verhältnis bezeichnet), ermöglicht die Analyse mehrerer Datengruppen, um die Variabilität zwischen Proben und innerhalb von Proben zu bestimmen.
Wenn zwischen den getesteten Gruppen kein wirklicher Unterschied besteht, was als Nullhypothese bezeichnet wird, liegt das Ergebnis der F-Verhältnis-Statistik der ANOVA nahe bei 1. Schwankungen in der Stichprobe folgen wahrscheinlich der Fisher-F-Verteilung. Dies ist eine Gruppe von Verteilungsfunktionen mit zwei Kennzahlen, die als Zählerfreiheitsgrade und Nennerfreiheitsgrade bezeichnet werden.
Die zentralen Thesen
- Die Varianzanalyse (ANOVA) ist eine statistische Methode, die beobachtete Varianzdaten in verschiedene Komponenten aufteilt, um sie für zusätzliche Tests zu verwenden. Eine Einweg-ANOVA wird für drei oder mehr Datengruppen verwendet, um Informationen über die Beziehung zwischen abhängigen und zu erhalten unabhängige Variablen. Wenn zwischen den Gruppen keine echte Varianz besteht, sollte das F-Verhältnis der ANOVA nahe 1 liegen.
Beispiel für die Verwendung von ANOVA
Ein Forscher könnte zum Beispiel Studenten aus mehreren Colleges testen, um festzustellen, ob Studenten aus einem der Colleges konsistent besser abschneiden als Studenten aus den anderen Colleges. In einer Geschäftsanwendung kann ein F & E-Forscher zwei verschiedene Prozesse zur Erstellung eines Produkts testen, um festzustellen, ob ein Prozess hinsichtlich der Kosteneffizienz besser ist als der andere.
Die Art des verwendeten ANOVA-Tests hängt von einer Reihe von Faktoren ab. Es wird angewendet, wenn Daten experimentell sein müssen. Die Varianzanalyse wird angewendet, wenn kein Zugriff auf statistische Software besteht, wodurch die ANOVA von Hand berechnet wird. Es ist einfach zu bedienen und am besten für kleine Proben geeignet. Bei vielen Versuchsplänen müssen die Stichprobengrößen für die verschiedenen Faktorstufen-Kombinationen gleich sein.
ANOVA ist hilfreich zum Testen von drei oder mehr Variablen. Es ähnelt mehreren T-Tests mit zwei Stichproben. Es führt jedoch zu weniger Fehlern des Typs I und ist für eine Reihe von Problemen geeignet. ANOVA gruppiert Unterschiede, indem es die Mittelwerte jeder Gruppe vergleicht und die Varianz auf verschiedene Quellen verteilt. Es wird mit Probanden, Testgruppen, zwischen Gruppen und innerhalb von Gruppen eingesetzt.
Einweg-ANOVA Versus Zweiweg-ANOVA
Es gibt zwei Arten von ANOVA: einseitige (oder unidirektionale) und zweiseitige. Einweg oder Zweiweg bezieht sich auf die Anzahl unabhängiger Variablen in Ihrer Varianzanalyse. Eine Einweg-ANOVA bewertet die Auswirkung eines einzigen Faktors auf eine einzige Antwortvariable. Es wird bestimmt, ob alle Stichproben gleich sind. Die Einweg-ANOVA wird verwendet, um festzustellen, ob statistisch signifikante Unterschiede zwischen den Mitteln von drei oder mehr unabhängigen (nicht verwandten) Gruppen bestehen.
Eine Zweiweg-ANOVA ist eine Erweiterung der Einweg-ANOVA. Mit einer Einbahnstraße haben Sie eine unabhängige Variable, die sich auf eine abhängige Variable auswirkt. Bei einer Zwei-Wege-ANOVA gibt es zwei unabhängige Faktoren. Zum Beispiel ermöglicht eine bidirektionale ANOVA einem Unternehmen, die Produktivität von Arbeitnehmern anhand zweier unabhängiger Variablen wie Gehalt und Qualifikation zu vergleichen. Es wird verwendet, um die Wechselwirkung zwischen den beiden Faktoren zu beobachten und die Wirkung von zwei Faktoren gleichzeitig zu testen.