Was ist die empirische Regel?
Die empirische Regel, auch als Drei-Sigma-Regel oder 68-95-99.7-Regel bezeichnet, ist eine statistische Regel, die besagt, dass bei einer Normalverteilung fast alle Daten innerhalb von drei Standardabweichungen (bezeichnet mit σ) des Mittelwerts liegen (bezeichnet mit µ). Zusammengefasst zeigt die empirische Regel, dass 68% innerhalb der ersten Standardabweichung (µ ± σ), 95% innerhalb der ersten beiden Standardabweichungen (µ ± 2σ) und 99, 7% innerhalb der ersten drei Standardabweichungen (µ ± 3σ) liegen..
Empirische Regel
Die empirische Regel verstehen
Die empirische Regel wird in der Statistik häufig zur Vorhersage der Endergebnisse verwendet. Nach der Berechnung der Standardabweichung und vor der Erfassung genauer Daten kann diese Regel als grobe Schätzung des Ergebnisses der bevorstehenden Daten verwendet werden. Diese Wahrscheinlichkeit kann in der Zwischenzeit verwendet werden, da das Sammeln geeigneter Daten zeitaufwändig oder sogar unmöglich sein kann. Die empirische Regel wird auch verwendet, um die "Normalität" einer Verteilung grob zu testen. Wenn zu viele Datenpunkte außerhalb der drei Standardabweichungsgrenzen liegen, deutet dies darauf hin, dass die Verteilung nicht normal ist.
Die zentralen Thesen
- Die empirische Regel besagt, dass fast alle Daten innerhalb von 3 Standardabweichungen des Mittelwerts für eine Normalverteilung liegen. Nach dieser Regel liegen 68% der Daten innerhalb einer Standardabweichung. Fünfundneunzig Prozent der Daten liegen innerhalb von zwei Standardabweichungen Drei Standardabweichungen machen 99, 7% der Daten aus.
Beispiele für die empirische Regel
Nehmen wir an, eine Population von Tieren in einem Zoo ist als normal verbreitet bekannt. Jedes Tier wird im Durchschnitt 13, 1 Jahre alt (Mittelwert) und die Standardabweichung der Lebensdauer beträgt 1, 5 Jahre. Wenn jemand die Wahrscheinlichkeit wissen möchte, dass ein Tier länger als 14, 6 Jahre lebt, könnte er die empirische Regel anwenden. Bei einem Durchschnittsalter der Verteilung von 13, 1 Jahren ergeben sich für jede Standardabweichung die folgenden Altersgruppen:
- Eine Standardabweichung (µ ± σ): (13, 1 - 1, 5) bis (13, 1 + 1, 5) oder 11, 6 bis 14, 6 Zwei Standardabweichungen (µ ± 2σ): 13, 1 - (2 x 1, 5) bis 13, 1 + (2 x 1, 5) oder 10, 1 bis 16, 1Drei Standardabweichungen (µ ± 3σ): 13, 1 - (3 × 1, 5) bis 13, 1 + (3 × 1, 5) oder 8, 6 bis 17, 6
Die Person, die dieses Problem löst, muss die Gesamtwahrscheinlichkeit des Tieres berechnen, das 14, 6 Jahre oder länger lebt. Die empirische Regel zeigt, dass 68% der Verteilung innerhalb einer Standardabweichung liegen, in diesem Fall von 11, 6 bis 14, 6 Jahren. Somit liegen die restlichen 32% der Verteilung außerhalb dieses Bereichs. Die Hälfte liegt über 14, 6 und die Hälfte liegt unter 11, 6. Die Wahrscheinlichkeit, dass das Tier länger als 14, 6 Jahre lebt, beträgt 16% (berechnet als 32% geteilt durch zwei).
Nehmen Sie als weiteres Beispiel stattdessen an, dass ein Tier im Zoo durchschnittlich 10 Jahre alt ist und eine Standardabweichung von 1, 4 Jahren aufweist. Angenommen, der Tierpfleger versucht, die Wahrscheinlichkeit eines Tieres zu ermitteln, das länger als 7, 2 Jahre lebt. Diese Verteilung sieht wie folgt aus:
- Eine Standardabweichung (µ ± σ): 8, 6 bis 11, 4 JahreZwei Standardabweichungen (µ ± 2σ): 7, 2 bis 12, 8 JahreDrei Standardabweichungen ((µ ± 3σ): 5, 8 bis 14, 2 Jahre
Die empirische Regel besagt, dass 95% der Verteilung innerhalb von zwei Standardabweichungen liegen. Somit liegen 5% außerhalb von zwei Standardabweichungen; halb über 12, 8 Jahre und halb unter 7, 2 Jahre. Die Wahrscheinlichkeit, länger als 7, 2 Jahre zu leben, beträgt also:
95% + (5% / 2) = 97, 5%