Was ist deskriptive Statistik?
Beschreibende Statistiken sind kurze beschreibende Koeffizienten, die einen bestimmten Datensatz zusammenfassen. Dabei kann es sich entweder um eine Darstellung der gesamten Population oder um eine Stichprobe einer Population handeln. Die deskriptive Statistik wird in zentrale Tendenz- und Variabilitätsmaße (Spread) unterteilt. Die Messungen der zentralen Tendenz umfassen den Mittelwert, den Median und den Modus, während die Messungen der Variabilität die Standardabweichung, die Varianz, die minimalen und maximalen Variablen sowie die Kurtosis und die Schiefe umfassen.
Was ist deskriptive Statistik?
Grundlegendes zur beschreibenden Statistik
Kurz gesagt, beschreibende Statistiken helfen, die Merkmale eines bestimmten Datensatzes zu beschreiben und zu verstehen, indem sie kurze Zusammenfassungen über die Stichprobe und die Maße der Daten geben. Die bekanntesten Arten der deskriptiven Statistik sind Maße für den Mittelpunkt: Mittelwert, Median und Modus, die auf fast allen Ebenen der Mathematik und Statistik verwendet werden. Der Mittelwert oder der Durchschnitt wird berechnet, indem alle Zahlen im Datensatz addiert und dann durch die Anzahl der Zahlen im Datensatz dividiert werden. Beispielsweise ist die Summe des folgenden Datensatzes 20: (2, 3, 4, 5, 6). Der Mittelwert ist 4 (20/5). Der Modus eines Datensatzes ist der Wert, der am häufigsten vorkommt, und der Median ist die Zahl, die sich in der Mitte des Datensatzes befindet. Es ist die Zahl, die die höheren Zahlen von den niedrigeren Zahlen innerhalb eines Datensatzes trennt. Es gibt jedoch weniger gebräuchliche beschreibende Statistiken, die immer noch sehr wichtig sind.
Menschen verwenden deskriptive Statistiken, um schwer verständliche quantitative Erkenntnisse über einen großen Datensatz in mundgerechte Beschreibungen umzuwandeln. Beispielsweise vermittelt der Notendurchschnitt eines Schülers ein gutes Verständnis für deskriptive Statistiken. Die Idee eines GPA besteht darin, Datenpunkte aus einer Vielzahl von Prüfungen, Klassen und Noten zu verwenden und diese zu mitteln, um ein allgemeines Verständnis der allgemeinen akademischen Fähigkeiten eines Schülers zu vermitteln. Der persönliche GPA eines Schülers spiegelt seine mittlere akademische Leistung wider.
Die zentralen Thesen
- In der deskriptiven Statistik werden die Merkmale eines Datensatzes zusammengefasst oder beschrieben. In der deskriptiven Statistik werden zwei grundlegende Kategorien von Maßnahmen unterschieden: Maßnahmen der zentralen Tendenz und Maßnahmen der Variabilität oder Streuung. Maßnahmen der zentralen Tendenz beschreiben die Mitte eines Datensatzes. Maßnahmen der Variabilität oder Streuung beschreiben die Streuung der Daten innerhalb des Satzes.
Maßnahmen der deskriptiven Statistik
Alle deskriptiven Statistiken sind entweder Maßzahlen für die zentrale Tendenz oder Maßzahlen für die Variabilität, auch als Maßzahlen für die Streuung bekannt. Maßnahmen der zentralen Tendenz konzentrieren sich auf den Mittelwert oder den Mittelwert von Datensätzen; Variabilitätsmessungen konzentrieren sich auf die Streuung von Daten. Diese beiden Kennzahlen verwenden Diagramme, Tabellen und allgemeine Diskussionen, um die Bedeutung der analysierten Daten zu verstehen.
Messungen der zentralen Tendenz beschreiben die zentrale Position einer Verteilung für einen Datensatz. Eine Person analysiert die Häufigkeit jedes Datenpunkts in der Verteilung und beschreibt sie unter Verwendung des Mittelwerts, Medians oder Modus, der die häufigsten Muster des analysierten Datensatzes misst.
Messungen der Variabilität oder der Streuung helfen bei der Analyse, wie verteilt die Verteilung für einen Datensatz ist. Während beispielsweise die Maße der zentralen Tendenz einer Person den Durchschnitt eines Datensatzes geben können, beschreibt sie nicht, wie die Daten innerhalb des Datensatzes verteilt sind. Während also der Durchschnitt der Daten 65 von 100 sein kann, können immer noch Datenpunkte sowohl bei 1 als auch bei 100 vorhanden sein. Variabilitätsmessungen helfen, dies zu kommunizieren, indem sie die Form und Ausbreitung des Datensatzes beschreiben. Reichweite, Quartile, absolute Abweichung und Varianz sind Beispiele für Variabilitätsmaße. Betrachten Sie den folgenden Datensatz: 5, 19, 24, 62, 91, 100. Der Bereich dieses Datensatzes ist 95, der durch Subtrahieren der niedrigsten Zahl (5) im Datensatz von der höchsten Zahl (100) berechnet wird.