Die Normalverteilungsformel basiert auf zwei einfachen Parametern - Mittelwert und Standardabweichung -, die die Eigenschaften eines bestimmten Datensatzes quantifizieren. Während der Mittelwert den "zentralen" oder Durchschnittswert des gesamten Datensatzes angibt, gibt die Standardabweichung die "Streuung" oder Variation von Datenpunkten um diesen Mittelwert an.
Betrachten Sie die folgenden 2 Datensätze:
Datensatz 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Datensatz 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Für Datensatz1 ist Mittelwert = 10 und Standardabweichung (stddev) = 0
Für Datensatz 2 ist Mittelwert = 10 und Standardabweichung (stddev) = 2, 83
Zeichnen wir diese Werte für DataSet1:
Ähnliches gilt für DataSet2:
Die rote horizontale Linie in beiden obigen Diagrammen gibt den „Mittelwert“ oder Durchschnittswert jedes Datensatzes an (10 in beiden Fällen). Die rosa Pfeile in der zweiten Grafik zeigen die Streuung oder Abweichung der Datenwerte vom Mittelwert an. Dies wird im Falle von DataSet2 durch den Standardabweichungswert von 2, 83 dargestellt. Da DataSet1 alle gleichen Werte (jeweils 10) und keine Abweichungen aufweist, ist der stddev-Wert Null, und daher sind keine rosa Pfeile anwendbar.
Der stddev-Wert weist einige signifikante und nützliche Eigenschaften auf, die bei der Datenanalyse äußerst hilfreich sind. Bei einer Normalverteilung sind die Datenwerte auf beiden Seiten des Mittelwerts symmetrisch verteilt. Zeichnen Sie für einen normal verteilten Datensatz ein Diagramm mit stddev auf der horizontalen Achse und der Nr. von Datenwerten auf der vertikalen Achse wird das folgende Diagramm erhalten.
Eigenschaften einer Normalverteilung
- Die Normalkurve ist symmetrisch zum Mittelwert. Der Mittelwert liegt in der Mitte und teilt die Fläche in zwei Hälften. Die Gesamtfläche unter der Kurve ist 1 für Mittelwert = 0 und stdev = 1. Die Verteilung wird vollständig durch ihren Mittelwert beschrieben und stddev
Wie aus dem obigen Diagramm ersichtlich, stellt stddev Folgendes dar:
- 68, 3% der Datenwerte liegen innerhalb von 1 Standardabweichung vom Mittelwert (-1 bis +1) 95, 4% der Datenwerte liegen innerhalb von 2 Standardabweichungen vom Mittelwert (-2 bis +2) 99, 7% der Datenwerte liegen innerhalb von 3 Standardabweichungen vom Mittelwert (-3 bis +3)
Die Fläche unter der glockenförmigen Kurve gibt bei Messung die gewünschte Wahrscheinlichkeit für einen bestimmten Bereich an:
- kleiner als X: - zB Wahrscheinlichkeit, dass Datenwerte kleiner als 70 größer als X sind - zB Wahrscheinlichkeit, dass Datenwerte größer als 95 zwischen X 1 und X 2 sind - zB Wahrscheinlichkeit, dass Datenwerte zwischen 65 und 85 liegen
wobei X ein interessierender Wert ist (Beispiele unten).
Das Zeichnen und Berechnen der Fläche ist nicht immer praktisch, da unterschiedliche Datensätze unterschiedliche Mittelwerte und stddev-Werte haben. Um eine einheitliche Standardmethode für einfache Berechnungen und die Anwendbarkeit auf Probleme der realen Welt zu ermöglichen, wurde die Standardumrechnung in Z-Werte eingeführt, die Teil der Normalverteilungstabelle sind.
Z = (X - Mittelwert) / stddev, wobei X die Zufallsvariable ist.
Grundsätzlich erzwingt diese Konvertierung, dass der Mittelwert und der Wert für stddev auf 0 bzw. 1 standardisiert werden, was es ermöglicht, einen standardmäßig definierten Satz von Z-Werten (aus der Normalverteilungstabelle) für einfache Berechnungen zu verwenden. Ein Schnappschuss einer Standard-Z-Wert-Tabelle mit Wahrscheinlichkeitswerten sieht folgendermaßen aus:
z |
0, 00 |
0, 01 |
0, 02 |
0, 03 |
0, 04 |
0, 05 |
0, 06 |
0.0 |
0, 00000 |
0, 00399 |
0, 00798 |
0, 01197 |
0, 01595 |
0, 01994 |
… |
0, 1 |
0, 0398 |
0, 04380 |
0, 04776 |
0, 05172 |
0, 05567 |
0, 05966 |
… |
0, 2 |
0, 0793 |
0, 08317 |
0, 08706 |
0, 09095 |
0, 09483 |
0, 09871 |
… |
0, 3 |
0, 11791 |
0, 12172 |
0, 12552 |
0, 12930 |
0, 13307 |
0, 13683 |
… |
0, 4 |
0, 15542 |
0, 15910 |
0, 16276 |
0, 16640 |
0, 17003 |
0, 17364 |
… |
0, 5 |
0, 19146 |
0, 19497 |
0, 19847 |
0.20194 |
0, 20540 |
0, 20884 |
… |
0, 6 |
0, 22575 |
0, 22907 |
0, 23237 |
0, 23565 |
0, 23891 |
0, 24215 |
… |
0, 7 |
0, 25804 |
0, 26115 |
0, 26424 |
0, 26730 |
0, 27035 |
0, 27337 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
Um die Wahrscheinlichkeit für den z-Wert von 0, 239865 zu ermitteln, runden Sie ihn zunächst auf 2 Dezimalstellen (dh 0, 24) ab. Überprüfen Sie dann die ersten beiden Stellen (0, 2) in den Zeilen und die niedrigstwertige Stelle (verbleibend 0, 04) in der Spalte. Dies führt zu einem Wert von 0, 09483.
Die vollständige Normalverteilungstabelle mit einer Genauigkeit von bis zu 5 Dezimalstellen für Wahrscheinlichkeitswerte (einschließlich der für negative Werte) finden Sie hier.
Schauen wir uns einige Beispiele aus dem wirklichen Leben an. Die Größe von Individuen in einer großen Gruppe folgt einem normalen Verteilungsmuster. Angenommen, wir haben eine Gruppe von 100 Personen, deren Höhen aufgezeichnet werden, und der Mittelwert und der stddev werden mit 66 bzw. 6 Zoll berechnet.
Hier einige Beispielfragen, die mit der Z-Wert-Tabelle leicht beantwortet werden können:
- Was ist die Wahrscheinlichkeit, dass eine Person in der Gruppe 70 Zoll oder weniger ist?
Frage ist, kumulativen Wert von P (X <= 70) zu finden, dh im gesamten Datensatz von 100, wie viele Werte zwischen 0 und 70 sein werden.
Lassen Sie uns zuerst den X-Wert von 70 in den entsprechenden Z-Wert konvertieren.
Z = (X - Mittelwert) / stddev = (70-66) / 6 = 4/6 = 0, 66667 = 0, 67 (auf 2 Dezimalstellen gerundet)
Wir müssen jetzt P (Z <= 0.67) = 0 finden. 24857 (aus der obigen Z-Tabelle)
Das heißt, es besteht eine Wahrscheinlichkeit von 24, 857%, dass eine Person in der Gruppe kleiner oder gleich 70 Zoll ist.
Aber Moment mal - das oben Gesagte ist unvollständig. Denken Sie daran, wir suchen nach einer Wahrscheinlichkeit für alle möglichen Höhen bis zu 70, dh von 0 bis 70. Das oben Gesagte gibt nur den Anteil vom Mittelwert bis zum gewünschten Wert (dh 66 bis 70) an. Wir müssen die andere Hälfte einschließen - von 0 bis 66 -, um die richtige Antwort zu erhalten.
Da 0 bis 66 den halben Teil darstellen (dh einen extremen bis mittleren Mittelwert), beträgt seine Wahrscheinlichkeit einfach 0, 5.
Daher ist die korrekte Wahrscheinlichkeit, dass eine Person 70 Zoll oder weniger ist, = 0, 24857 + 0, 5 = 0. 74857 = 74, 857%
Grafisch (durch Berechnung der Fläche) sind dies die beiden summierten Regionen, die die Lösung darstellen:
- Was ist die Wahrscheinlichkeit, dass eine Person 75 Zoll oder höher ist?
dh Finde komplementäres kumulatives P (X> = 75).
Z = (X - Mittelwert) / stddev = (75-66) / 6 = 9/6 = 1, 5
P (Z> = 1, 5) = 1 - P (Z <= 1, 5) = 1 - (0, 5 + 0, 43319) = 0, 06681 = 6, 681%
- Wie groß ist die Wahrscheinlichkeit, dass eine Person zwischen 52 und 67 Zoll groß ist?
Finden Sie P (52 <= X <= 67).
P (52 <= X <= 67) = P = P (-2, 33 <= Z <= 0, 17)
= P (Z <= 0, 17) - P (Z <= -0, 233) = (0, 5 + 0, 56749) - (0, 40905) =
Diese Normalverteilungstabelle (und die Z-Werte) werden häufig für Wahrscheinlichkeitsberechnungen zu erwarteten Kursbewegungen an den Aktienmärkten für Aktien und Indizes verwendet. Sie werden im bereichsbezogenen Handel verwendet, um Aufwärtstrend oder Abwärtstrend, Unterstützungs- oder Widerstandsniveaus und andere technische Indikatoren zu identifizieren, die auf normalen Verteilungskonzepten für Mittelwert und Standardabweichung basieren.
Anlagekonten vergleichen × Die in dieser Tabelle aufgeführten Angebote stammen von Partnerschaften, für die Investopedia eine Vergütung erhält. Anbietername BeschreibungIn Verbindung stehende Artikel
Trading Grundausbildung
Hypothesentest im Finanzbereich: Konzept und Beispiele
Risikomanagement
Optimieren Sie Ihr Portfolio mithilfe der Normalverteilung
Technische Analyse Grundausbildung
Die lineare Regression von Zeit und Preis
Risikomanagement
Die Verwendung und Grenzen der Volatilität
Finanzanalyse
Berechnung des Value at Risk (VaR) in Excel
Werkzeuge zur Fundamentalanalyse
Grundlegendes zu Volatilitätsmessungen
Partner-LinksVerwandte Begriffe
Konfidenzintervalldefinition Konfidenzintervall in der Statistik bezieht sich auf die Wahrscheinlichkeit, dass ein Populationsparameter zwischen zwei festgelegten Werten liegt. mehr Risikomanagement in der Finanzwelt In der Finanzwelt ist Risikomanagement der Prozess der Identifizierung, Analyse und Akzeptanz oder Minderung von Unsicherheiten bei Anlageentscheidungen. Das Risikomanagement erfolgt immer dann, wenn ein Anleger oder Fondsmanager eine Analyse vornimmt und versucht, das Verlustrisiko einer Anlage zu quantifizieren. mehr Informationen zur Kassakurve des Kassakurses Die Kassakurve des Kassakurses wird als Zinskurve definiert, die nicht aus Renditen, sondern aus Kassakursen des Kassakurses erstellt wird. Die Kassakurve kann als Benchmark für die Bewertung von Anleihen verwendet werden. mehr Definition des Gini-Index Der Gini-Index ist ein statistisches Maß für die Verteilung, das häufig als Maß für die wirtschaftliche Ungleichheit verwendet wird. mehr Capital Asset Pricing Model (CAPM) Das Capital Asset Pricing Model beschreibt die Beziehung zwischen Risiko und erwarteter Rendite. mehr Das harmonische Mittel verstehen Das harmonische Mittel ist ein Durchschnitt, der im Finanzwesen verwendet wird, um ein Vielfaches wie das Kurs-Gewinn-Verhältnis zu mitteln. Mehr