Inhaltsverzeichnis
Einführung in die Statistik — Inhaltsverzeichnis
Hauptseite

Verteilungstypen
Summenfunktion und approximierende Verteilungsfunktion
Mittelwerte der Lage

Summenfunktion und approximierende Verteilungsfunktion

Eindimensionale Häufigkeitsverteilung beschreibt die Verteilung der Häufigkeiten eines einzelnen Merkmals innerhalb einer Datenmenge. Hierbei wird erfasst, wie oft verschiedene Werte des Merkmals in den Daten vorkommen.

Summenfunktion (kumulative Verteilungsfunktion) und approximierende Verteilungsfunktion sind wichtige Konzepte zur Beschreibung und Analyse von Häufigkeitsverteilungen.

Summenfunktion (kumulative Verteilungsfunktion, KFV)

Die Summenfunktion, oft auch als kumulative Verteilungsfunktion (KFV) bezeichnet, ist eine Funktion, die angibt, wie viele Beobachtungen kleiner oder gleich einem bestimmten Wert sind. Mathematisch ausgedrückt, ist die KFV $F(x)$ für einen Wert $x$ definiert als die Summe der relativen Häufigkeiten aller Merkmalsausprägungen, die kleiner oder gleich $x$ sind.

Definition:
Für eine endliche Anzahl von Beobachtungen $x_1, x_2, ..., x_n$ ist die kumulative Verteilungsfunktion $F(x)$ gegeben durch: $F(x) = P(X \leq x)$

Beispiel: Angenommen, wir haben die folgenden Daten über die Anzahl der Bücher, die von 10 Studenten in einem Monat gelesen wurden: 1, 2, 2, 3, 3, 3, 4, 5, 5, 6. Die Häufigkeitsverteilung wäre:

Die kumulative Verteilungsfunktion berechnet sich wie folgt:

Die kumulative Verteilungsfunktion zeigt also, wie viele Studenten bis zu einem bestimmten Wert gelesen haben. Diese Werte können dann in einem Diagramm als eine treppenförmige Funktion dargestellt werden, die immer weiter ansteigt, bis sie den Wert 1 erreicht.

Approximierende Verteilungsfunktion

Eine approximierende Verteilungsfunktion ist eine glatte Kurve, die die Kumulativen Häufigkeiten näherungsweise beschreibt. Diese Funktion wird häufig verwendet, wenn wir eine theoretische Verteilung modellieren wollen, die der empirischen Verteilung der Daten nahekommt. Zwei häufig verwendete Verteilungsfunktionen sind die Normalverteilung und die Exponentialverteilung.

Normalverteilung:
Die Normalverteilung ist eine glockenförmige Kurve, die durch zwei Parameter beschrieben wird: den Mittelwert (Durchschnitt) und die Standardabweichung (ein Maß für die Streuung). Die Normalverteilung wird häufig verwendet, weil viele natürliche Phänomene, wie Körpergrößen oder Testergebnisse, sich gut durch sie beschreiben lassen.

Definition:
Die Normalverteilungsfunktion $N(x)$ für einen Wert $x$ ist gegeben durch: $N(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)$ wobei (\mu) der Mittelwert und (\sigma) die Standardabweichung ist.

Anwendung:
Wenn unsere Daten gut durch eine Normalverteilung beschrieben werden können, können wir die empirische kumulative Verteilungsfunktion durch eine theoretische Normalverteilungsfunktion approximieren. Dies erlaubt uns, Wahrscheinlichkeiten für Werte zu berechnen, die in den Daten nicht direkt beobachtet wurden.

Beispiel:
Setzen wir den Mittelwert der Bücher auf 3,5 und die Standardabweichung auf 1,5, dann würde die Normalverteilungsfunktion genutzt, um zu approximieren, wie viele Studenten weniger als eine bestimmte Anzahl von Büchern gelesen haben.

Die approximierende Verteilungsfunktion ist besonders nützlich in der Statistik, um Prognosen zu treffen und inferenzielle Schlüsse zu ziehen. Sie ermöglicht es uns, die empirischen Daten besser zu verstehen und theoretische Modelle anzuwenden, die die Realität möglichst genau abbilden.

Zusammenfassung:


Impressum
Datenschutz

annehmen ablehnen

Auf dieser Website werden Cookies und Pixel-Tags verwendet. Durch die Nutzung dieser Website erklären Sie sich mit der Verwendung von Cookies einverstanden. Mehr zum Thema Cookies und siehe auch Datenschutz