Inhaltsverzeichnis
- Was ist ein T-Test?
- Den T-Test erklären
- Mehrdeutige Testergebnisse
- T-Test Annahmen
- Berechnung von T-Tests
- Korrelierter (oder gepaarter) T-Test
- Gleiche Varianz (gepoolt) T-Test
- T-Test mit ungleicher Varianz
- Bestimmen, welcher T-Test verwendet werden soll
- T-Test-Beispiel für ungleiche Varianz
Was ist ein T-Test?
Ein t-Test ist eine Art Inferenzstatistik, die verwendet wird, um festzustellen, ob es einen signifikanten Unterschied zwischen den Mitteln zweier Gruppen gibt, die in bestimmten Merkmalen zusammenhängen können. Es wird meistens verwendet, wenn die Datensätze, wie der Datensatz, der als Ergebnis des 100-maligen Münzwurfs aufgezeichnet wurde, einer Normalverteilung folgen und möglicherweise unbekannte Abweichungen aufweisen. Ein t-Test wird als Hypothesentest-Tool verwendet, mit dem eine für eine Population geltende Annahme getestet werden kann.
Ein t-Test untersucht die t-Statistik, die t-Verteilungswerte und die Freiheitsgrade, um die Wahrscheinlichkeit eines Unterschieds zwischen zwei Datensätzen zu bestimmen. Um einen Test mit drei oder mehr Variablen durchzuführen, muss eine Varianzanalyse durchgeführt werden.
T-Test
Den T-Test erklären
Im Wesentlichen können wir mit einem T-Test die Durchschnittswerte der beiden Datensätze vergleichen und feststellen, ob sie aus derselben Grundgesamtheit stammen. Wenn wir in den obigen Beispielen eine Stichprobe von Schülern der Klasse A und eine weitere Stichprobe von Schülern der Klasse B nehmen würden, würden wir nicht erwarten, dass sie genau den gleichen Mittelwert und die gleiche Standardabweichung aufweisen. In ähnlicher Weise sollten Proben aus der mit Placebo gefütterten Kontrollgruppe und Proben aus der mit Medikamenten verschriebenen Gruppe einen geringfügig anderen Mittelwert und eine geringfügig andere Standardabweichung aufweisen.
Mathematisch nimmt der t-Test eine Stichprobe aus jeder der beiden Mengen und stellt die Problemstellung her, indem er eine Nullhypothese annimmt, dass die beiden Mittelwerte gleich sind. Basierend auf den anwendbaren Formeln werden bestimmte Werte berechnet und mit den Standardwerten verglichen, und die angenommene Nullhypothese wird entsprechend akzeptiert oder abgelehnt.
Wenn die Nullhypothese abgelehnt werden kann, bedeutet dies, dass die Daten stark und nicht zufällig gelesen werden. Der t-Test ist nur einer von vielen Tests, die für diesen Zweck verwendet werden. Statistiker müssen zusätzlich andere Tests als den T-Test verwenden, um mehr Variablen und Tests mit größeren Stichproben zu untersuchen. Für eine große Stichprobe verwenden Statistiker einen Z-Test. Weitere Testmöglichkeiten sind der Chi-Quadrat-Test und der F-Test.
Es gibt drei Arten von T-Tests, die als abhängige und unabhängige T-Tests klassifiziert werden.
Die zentralen Thesen
- Ein t-Test ist eine Art Inferenzstatistik, die verwendet wird, um zu bestimmen, ob es einen signifikanten Unterschied zwischen den Mitteln zweier Gruppen gibt, die in bestimmten Merkmalen verwandt sein können. Der t-Test ist einer von vielen Tests, die zum Zweck des Hypothesentests verwendet werden Für die Berechnung eines T-Tests sind drei Schlüsseldatenwerte erforderlich. Sie umfassen die Differenz zwischen den Mittelwerten aus jedem Datensatz (als Mittelwertdifferenz bezeichnet), die Standardabweichung jeder Gruppe und die Anzahl der Datenwerte jeder Gruppe. Es gibt verschiedene Arten von t-Tests, die abhängig voneinander durchgeführt werden können zu den erforderlichen Daten und der Art der Analyse.
Mehrdeutige Testergebnisse
Bedenken Sie, dass ein Arzneimittelhersteller ein neu erfundenes Arzneimittel testen möchte. Es folgt dem Standardverfahren, bei dem das Medikament an einer Patientengruppe ausprobiert und einer anderen Gruppe, der Kontrollgruppe, ein Placebo verabreicht wird. Das Placebo, das der Kontrollgruppe verabreicht wird, ist eine Substanz ohne beabsichtigten therapeutischen Wert und dient als Benchmark, um zu messen, wie die andere Gruppe, der das eigentliche Arzneimittel verabreicht wird, reagiert.
Nach der Arzneimittelstudie berichteten die Mitglieder der mit Placebo gefütterten Kontrollgruppe über einen Anstieg der durchschnittlichen Lebenserwartung um drei Jahre, während die Mitglieder der Gruppe, denen das neue Arzneimittel verschrieben wurde, einen Anstieg der durchschnittlichen Lebenserwartung um vier Jahre berichteten. Eine sofortige Beobachtung kann darauf hindeuten, dass das Medikament tatsächlich wirkt, da die Ergebnisse für die Gruppe, die das Medikament einnimmt, besser sind. Es ist jedoch auch möglich, dass die Beobachtung auf ein zufälliges Vorkommen zurückzuführen ist, insbesondere auf ein überraschendes Glück. Ein t-Test ist hilfreich, um festzustellen, ob die Ergebnisse tatsächlich korrekt sind und für die gesamte Bevölkerung gelten.
In einer Schule erzielten 100 Schüler der Klasse A durchschnittlich 85% mit einer Standardabweichung von 3%. Weitere 100 Schüler der Klasse B erzielten durchschnittlich 87% mit einer Standardabweichung von 4%. Während der Durchschnitt der Klasse B besser ist als der der Klasse A, ist es möglicherweise nicht richtig, zu der Schlussfolgerung zu gelangen, dass die Gesamtleistung der Schüler der Klasse B besser ist als die der Schüler der Klasse A. Dies liegt daran, dass zusammen mit dem Mittelwert ist die Standardabweichung von Klasse B auch höher als die von Klasse A. Dies zeigt, dass ihre extremen Prozentsätze auf der unteren und der oberen Seite im Vergleich zu denen von Klasse A viel weiter auseinander lagen. Ein t-Test kann dabei helfen, dies zu bestimmen Welcher Klasse erging es besser?
T-Test Annahmen
- Die erste Annahme in Bezug auf t-Tests betrifft den Maßstab der Messung. Bei einem t-Test wird davon ausgegangen, dass die auf die erfassten Daten angewendete Messskala einer kontinuierlichen oder ordinalen Skala folgt, z. B. den Punktzahlen für einen IQ-Test. Bei der zweiten Annahme handelt es sich um eine einfache Zufallsstichprobe, bei der es sich um Daten handelt gesammelt von einem repräsentativen, zufällig ausgewählten Teil der Gesamtpopulation. Die dritte Annahme ist, dass die Daten, wenn sie aufgezeichnet werden, eine normalverteilte, glockenförmige Verteilungskurve ergeben. Die vierte Annahme ist, dass eine ausreichend große Stichprobe verwendet wird. Eine größere Stichprobe bedeutet, dass sich die Verteilung der Ergebnisse einer normalen glockenförmigen Kurve annähern sollte. Die letzte Annahme ist die Homogenität der Varianz. Eine homogene oder gleiche Varianz liegt vor, wenn die Standardabweichungen der Stichproben ungefähr gleich sind.
Berechnung von T-Tests
Die Berechnung eines t-Tests erfordert drei Schlüsseldatenwerte. Sie umfassen die Differenz zwischen den Mittelwerten aus jedem Datensatz (als Mittelwertdifferenz bezeichnet), die Standardabweichung jeder Gruppe und die Anzahl der Datenwerte jeder Gruppe.
Das Ergebnis des t-Tests ergibt den t-Wert. Dieser berechnete t-Wert wird dann mit einem Wert verglichen, der aus einer kritischen Wertetabelle (der sogenannten T-Verteilungstabelle) erhalten wurde. Dieser Vergleich hilft zu bestimmen, wie wahrscheinlich die Differenz zwischen den Mitteln zufällig aufgetreten ist oder ob die Datensätze tatsächlich intrinsische Unterschiede aufweisen. Der t-Test fragt, ob der Unterschied zwischen den Gruppen einen wahren Unterschied in der Studie darstellt oder ob es sich wahrscheinlich um einen bedeutungslosen statistischen Unterschied handelt.
T-Verteilungstabellen
Die T-Verteilertabelle ist in den Formaten "One-Tail" und "Two-Tail" verfügbar. Ersteres dient zur Beurteilung von Fällen, die einen festen Wert oder Bereich mit einer eindeutigen Richtung (positiv oder negativ) haben. Wie groß ist beispielsweise die Wahrscheinlichkeit, dass der Ausgabewert unter -3 bleibt oder mehr als sieben erreicht, wenn ein Würfelpaar gewürfelt wird? Letzteres wird für die bereichsgebundene Analyse verwendet, z. B. um zu fragen, ob die Koordinaten zwischen -2 und +2 liegen.
Die Berechnungen können mit Standard-Softwareprogrammen durchgeführt werden, die die erforderlichen statistischen Funktionen unterstützen, wie sie in MS Excel enthalten sind.
T-Werte und Freiheitsgrade
Der t-Test liefert zwei Werte als Ausgabe: t-Wert und Freiheitsgrade. Der t-Wert ist ein Verhältnis der Differenz zwischen dem Mittelwert der beiden Stichproben und der Differenz, die innerhalb der Stichproben besteht. Während der Zählerwert (die Differenz zwischen dem Mittelwert der beiden Stichproben) einfach zu berechnen ist, kann der Nenner (die Differenz innerhalb der Stichproben) je nach Art der Datenwerte etwas kompliziert werden. Der Nenner des Verhältnisses ist ein Maß für die Streuung oder Variabilität. Höhere Werte des t-Werts, auch t-Score genannt, weisen darauf hin, dass zwischen den beiden Stichproben ein großer Unterschied besteht. Je kleiner der t-Wert ist, desto mehr Ähnlichkeit besteht zwischen den beiden Stichproben.
- Ein großer t-Score zeigt an, dass die Gruppen unterschiedlich sind. Ein kleiner t-Score zeigt an, dass die Gruppen ähnlich sind.
Freiheitsgrade beziehen sich auf die Werte in einer Studie, die die Freiheit haben zu variieren und wesentlich für die Beurteilung der Wichtigkeit und der Gültigkeit der Nullhypothese sind. Die Berechnung dieser Werte hängt normalerweise von der Anzahl der im Probensatz verfügbaren Datensätze ab.
Korrelierter (oder gepaarter) T-Test
Der korrelierte t-Test wird durchgeführt, wenn die Stichproben typischerweise aus übereinstimmenden Paaren ähnlicher Einheiten bestehen oder wenn es Fälle von wiederholten Messungen gibt. Beispielsweise kann es vorkommen, dass dieselben Patienten wiederholt getestet werden - vor und nach einer bestimmten Behandlung. In solchen Fällen wird jeder Patient als Kontrollprobe gegen sich selbst verwendet.
Diese Methode gilt auch für Fälle, in denen die Stichproben in irgendeiner Weise verwandt sind oder übereinstimmende Merkmale aufweisen, z. B. eine vergleichende Analyse mit Kindern, Eltern oder Geschwistern. Korrelierte oder gepaarte t-Tests sind von einem abhängigen Typ, da es sich um Fälle handelt, in denen die beiden Sätze von Stichproben zusammenhängen.
Die Formel zur Berechnung des t-Werts und der Freiheitsgrade für einen gepaarten t-Test lautet:
- Mean1 und Mean2 sind die Durchschnittswerte der einzelnen Stichproben, während var1 und var2 die Varianz der einzelnen Stichproben darstellen.
Die verbleibenden zwei Typen gehören zu den unabhängigen t-Tests. Die Stichproben dieser Typen werden unabhängig voneinander ausgewählt, dh, die Datensätze in den beiden Gruppen beziehen sich nicht auf dieselben Werte. Dazu gehören Fälle wie eine Gruppe von 100 Patienten, die in zwei Gruppen zu je 50 Patienten aufgeteilt werden. Eine der Gruppen wird zur Kontrollgruppe und erhält ein Placebo, während die andere Gruppe die verschriebene Behandlung erhält. Dies sind zwei unabhängige Stichprobengruppen, die nicht miteinander gepaart sind.
T-Test mit gleicher Varianz (oder gepoolt)
Der t-Test mit gleicher Varianz wird verwendet, wenn die Anzahl der Stichproben in jeder Gruppe gleich ist oder die Varianz der beiden Datensätze ähnlich ist. Die folgende Formel wird zur Berechnung des t-Werts und der Freiheitsgrade für den t-Test mit gleicher Varianz verwendet:
Um die Umstellung zu erleichtern, müssen Sie T-Wert = n1 + n2 - 2 (n1 - 1) × var12 + (n2 - 1) × var22 × n11 + n21 Mittelwert1 - Mittelwert2 wobei: Mittelwert1 und Mittelwert2 = Durchschnittswerte von jedem der Probensätze var1 und var2 = Varianz jeder der Stichprobengruppen n1 und n2 = Anzahl der Datensätze in jeder Stichprobengruppe
und, Um die Umstellung zu erleichtern, müssen Sie Freiheitsgrade = n1 + n2−2wo: n1 und n2 = Anzahl der Datensätze in jedem Sample-Set
T-Test mit ungleicher Varianz
Der t-Test mit ungleicher Varianz wird verwendet, wenn die Anzahl der Stichproben in jeder Gruppe unterschiedlich ist und die Varianz der beiden Datensätze ebenfalls unterschiedlich ist. Dieser Test wird auch als Welch-T-Test bezeichnet. Die folgende Formel wird zur Berechnung des t-Werts und der Freiheitsgrade für einen ungleichen Varianz-t-Test verwendet:
Um die Umstellung zu erleichtern, müssen Sie T-Wert = n1var12 + n2var22 Mittelwert1 - Mittelwert2 wobei: Mittelwert1 und Mittelwert2 = Durchschnittswerte der einzelnen Probensätze, var1 und var2 = Varianz der einzelnen Probensätze, n1 und n2 = Anzahl der Datensätze in jedem Probensatz
und, Um die Umstellung zu erleichtern, müssen Sie Freiheitsgrade = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 wobei: var1 und var2 = Varianz jeder der Stichprobenmengen n1 und n2 = Anzahl von Datensätzen in jedem Beispielsatz
Bestimmen des richtigen zu verwendenden T-Tests
Das folgende Flussdiagramm kann verwendet werden, um zu bestimmen, welcher t-Test basierend auf den Eigenschaften der Probensätze verwendet werden soll. Zu den wichtigsten zu berücksichtigenden Punkten gehören die Ähnlichkeit der Stichprobendatensätze, die Anzahl der Datensätze in jedem Stichprobensatz und die Varianz jedes Stichprobensatzes.
Bild von Julie Bang © Investopedia 2019
T-Test-Beispiel für ungleiche Varianz
Angenommen, wir messen die in einer Kunstgalerie erhaltenen Bilder diagonal. Eine Gruppe von Beispielen umfasst 10 Gemälde, während die andere 20 Gemälde umfasst. Die Datensätze mit den entsprechenden Mittel- und Varianzwerten lauten wie folgt:
Set 1 | Set 2 | |
19.7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23.3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20.6 | |
21, 95 | 13.7 | |
23.2 | ||
17.5 | ||
20.6 | ||
18 | ||
23.9 | ||
21.6 | ||
24.3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Bedeuten | 19.4 | 21.6 |
Varianz | 1.4 | 17.1 |
Obwohl der Mittelwert von Satz 2 höher ist als der von Satz 1, können wir nicht schlussfolgern, dass alle Gemälde eine durchschnittliche Länge von etwa 21, 6 Einheiten haben, da die Varianz von Satz 2 signifikant höher ist als die von Satz 1. Ist dies zufällig oder gibt es tatsächlich Unterschiede? in der Gesamtbevölkerung aller in der Kunstgalerie erhaltenen Gemälde? Wir stellen das Problem fest, indem wir die Nullhypothese annehmen, dass der Mittelwert zwischen den beiden Stichprobensätzen gleich ist, und einen t-Test durchführen, um zu bestätigen, ob die Hypothese zutrifft.
Da die Anzahl der Datensätze unterschiedlich ist (n1 = 10 und n2 = 20) und auch die Varianz unterschiedlich ist, werden für den obigen Datensatz der t-Wert und die Freiheitsgrade nach der im T-Test Ungleiche Varianz genannten Formel berechnet Sektion.
Der t-Wert beträgt -2, 24787. Da das Minuszeichen beim Vergleich der beiden t-Werte ignoriert werden kann, beträgt der berechnete Wert 2, 24787.
Der Wert für die Freiheitsgrade beträgt 24, 38 und wird aufgrund der Formeldefinition, die das Abrunden des Werts auf den kleinstmöglichen ganzzahligen Wert erfordert, auf 24 verringert.
Wann immer von einer Normalverteilung ausgegangen wird, kann als Akzeptanzkriterium ein Wahrscheinlichkeitsniveau (Alpha-Niveau, Signifikanzniveau, p ) angegeben werden. In den meisten Fällen kann ein 5% -Wert angenommen werden.
Unter Verwendung des Freiheitsgradwerts als 24 und eines Signifikanzniveaus von 5% ergibt ein Blick auf die T-Wert-Verteilungstabelle einen Wert von 2, 064. Ein Vergleich dieses Werts mit dem berechneten Wert von 2, 247 zeigt an, dass der berechnete t-Wert bei einem Signifikanzniveau von 5% größer als der Tabellenwert ist. Daher ist es sicher, die Nullhypothese abzulehnen, dass es keinen Unterschied zwischen den Mitteln gibt. Die Bevölkerungsgruppe weist intrinsische Unterschiede auf und sie sind nicht zufällig.
Anlagekonten vergleichen × Die in dieser Tabelle aufgeführten Angebote stammen von Partnerschaften, für die Investopedia eine Vergütung erhält. Anbietername BeschreibungVerwandte Begriffe
Funktionsweise der Varianzanalyse (ANOVA) Die Varianzanalyse (ANOVA) ist ein statistisches Analysewerkzeug, das die in einem Datensatz gefundene Gesamtvariabilität in zwei Komponenten unterteilt: zufällige und systematische Faktoren. mehr Z-Test Definition Ein Z-Test ist ein statistischer Test, der verwendet wird, um zu bestimmen, ob zwei Populationsmittelwerte unterschiedlich sind, wenn die Varianzen bekannt sind und die Stichprobengröße groß ist. mehr Freiheitsgrade Definition Freiheitsgrade bezieht sich auf die maximale Anzahl logisch unabhängiger Werte in der Datenstichprobe, bei denen es sich um Werte handelt, die die Freiheit haben, sich zu ändern. Weitere Informationen zur T-Verteilung Die AT-Verteilung ist eine Art Wahrscheinlichkeitsfunktion, mit der Populationsparameter für kleine Stichprobengrößen oder unbekannte Varianzen geschätzt werden können. mehr Was die Semi-Deviation misst Die Semi-Deviation ist eine Methode zur Bewertung der unterdurchschnittlichen Schwankungen der Kapitalrendite. Es wird als Alternative zur Standardabweichung verwendet. mehr Bonferroni-Test Ein Bonferroni-Test ist eine Art Mehrfachvergleichstest, der in der statistischen Analyse verwendet wird. mehr Partner LinksIn Verbindung stehende Artikel
Wirtschaft
Welche Annahmen werden bei der Durchführung eines T-Tests getroffen?
Risikomanagement
Verwendung der historischen Volatilität zur Messung des zukünftigen Risikos
Aktienhandelsstrategie & Bildung
So verwenden Sie Excel zur Simulation von Aktienkursen
Finanzielle Verhältnisse
Wie berechnet man den IRR in Excel?
Mathematik & Statistik
Was ist ein relativer Standardfehler?
Finanzielle Verhältnisse