Was ist der Winsorized Mean?
Winsorized Mean ist eine Methode zur Mittelwertbildung, bei der zunächst der kleinste und der größte Wert durch die Beobachtungen ersetzt werden, die ihnen am nächsten liegen. Dies wird durchgeführt, um die Auswirkung abnormaler Extremwerte oder Ausreißer auf die Berechnung zu begrenzen. Nach dem Ersetzen der Werte wird dann die arithmetische Mittelwertformel verwendet, um den winsorisierten Mittelwert zu berechnen.
Die Formel für den Winsorized Mean ist
Um die Umstellung zu erleichtern, müssen Sie Winsorized Mean = Nxn… xn + 1 + xn + 2… xn wobei: n = Die Anzahl der größten und kleinsten Datenpunkte, die durch die Beobachtung ersetzt werden sollen
Winsorized Mittel werden auf zwei Arten ausgedrückt. Ein "k n " winsorized Mittelwert bezieht sich auf das Ersetzen der "k" kleinsten und größten Beobachtungen, wobei "k" eine ganze Zahl ist. Ein "X%" -Winsorized-Mittelwert beinhaltet das Ersetzen eines bestimmten Prozentsatzes von Werten an beiden Enden der Daten.
Berechnen des Winsorized Mean
Der wonorisierte Mittelwert wird berechnet, indem der kleinste und der größte Datenpunkt ersetzt werden, dann alle Datenpunkte summiert werden und die Summe durch die Gesamtzahl der Datenpunkte dividiert wird.
Was sagt Ihnen der Winsorized Mean?
Das winsorisierte Mittel ist weniger empfindlich gegenüber Ausreißern, da es diese durch weniger extreme Werte ersetzen kann. Das heißt, es ist weniger anfällig für Konturen gegenüber dem Mittelwert. Wenn eine Verteilung jedoch Fettschwänze aufweist, hat der Effekt des Entfernens der höchsten und niedrigsten Werte in der Verteilung aufgrund der hohen Variabilitätszahl in den Verteilungszahlen nur geringen Einfluss.
Die zentralen Thesen
- Eine Mittelungsmethode, bei der die kleinsten und größten Werte durch die Beobachtungen ersetzt werden, die ihnen am nächsten liegen. Sie sind weniger anfällig für Ausreißer, da sie durch weniger extreme Werte ersetzt werden können. Sie unterscheiden sich vom getrimmten Mittelwert, bei dem Datenpunkte entfernt werden - obwohl dies das Ergebnis der beiden ist neigen dazu, nahe zu sein.
Beispiel für die Verwendung des Winsorized Mean
Man kann den winsorisierten Mittelwert für den folgenden Datensatz berechnen: 1, 5, 7, 8, 9, 10, 14. In diesem Beispiel nehmen wir an, dass der winsorisierte Mittelwert in der ersten Ordnung ist, und ersetzen den kleinsten und den größten Wert durch ihren nächste Beobachtungen.
Der Datensatz sieht nun wie folgt aus: 5, 5, 7, 8, 9, 10, 10. Wenn ein arithmetischer Durchschnitt des neuen Satzes gebildet wird, ergibt sich ein winsorisierter Mittelwert von 7, 7 oder (5 + 5 + 7 + 8 + 9 + 10 + 10) geteilt durch 7.
Oder betrachten Sie einen 20% -Winsorized-Mittelwert, der die oberen 10% und unteren 10% nimmt und sie durch ihren nächstgelegenen Wert ersetzt. Wir werden den folgenden Datensatz gewinnen: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Die beiden Kleinste und größte Datenpunkte oder 10% werden durch den nächstgelegenen Wert ersetzt. Somit ist der neue Datensatz: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Der Winsorized Mittelwert ist 33, 9 oder die Summe der Daten (678) geteilt durch die Gesamtzahl der Datenpunkte (20).
Der Unterschied zwischen Winsorized Mean und Trimmed Mean
Der Winsorized-Mittelwert umfasst das Ändern von Datenpunkten, während der getrimmte Mittelwert das Entfernen von Datenpunkten umfasst. Es ist üblich, dass der wonorisierte Mittelwert und der getrimmte Mittelwert nahe beieinander liegen.
Einschränkungen bei der Verwendung von Winsorized Mean
Ein Hauptnachteil für winsorized Mittel ist, dass sie Verzerrung in den Datensatz einführen. Zugegeben, der Datensatz ist nach der Änderung im Idealfall weniger verzerrt, als wenn Ausreißer beibehalten würden.
Erfahren Sie mehr über Winsorized Mean
Für verwandte Einsichten über die Unterschiede zwischen den wichtigsten Mittelwertberechnungen.