Eigenschaften der Chi Quadrat Verteilung
Eigenschaften der Chi Quadrat Verteilung
Die Chi Quadrat Verteilung, auch $\chi^{2}$-Verteilung genannt, ist eine wichtige stetige Wahrscheinlichkeitsverteilung in der Statistik. Sie wird häufig in Hypothesentests verwendet, insbesondere bei Tests zur Unabhängigkeit und Anpassungsgüte.
Grundbegriffe und Definitionen:
Stichprobe und Stichprobenumfang: Eine Stichprobe ist eine Teilmenge einer größeren Gruppe oder Population, die ausgewählt wird, um Informationen über die gesamte Population zu gewinnen. Der Stichprobenumfang $n$ ist die Anzahl der Beobachtungen in dieser Teilmenge.
Varianz und Freiheitsgrade: Varianz ist ein Maß dafür, wie stark die Werte in einer Stichprobe um ihren Mittelwert streuen. Freiheitsgrade (df) beziehen sich auf die Anzahl der unabhängigen Werte, die in einer Berechnung der Varianz verwendet werden können. Für die Chi-Quadrat-Verteilung ist die Anzahl der Freiheitsgrade gleich der Anzahl der betrachteten unabhängigen Zufallsvariablen.
Quadratsumme: Die Quadratsumme ist die Summe der quadrierten Abweichungen der Beobachtungen vom Mittelwert. Diese Größe wird oft verwendet, um die Streuung in den Daten zu messen.
Grundlegende Eigenschaften
Definition der Chi Quadrat Verteilung:
- Die Chi Quadrat Verteilung entsteht aus der Summe der Quadrate von $k$ unabhängigen standardnormalverteilten Zufallsvariablen. Eine standardnormalverteilte Zufallsvariable hat eine Normalverteilung mit einem Mittelwert von 0 und einer Standardabweichung von 1. Mathematisch ausgedrückt:$X_1, X_2, ..., X_k \sim N(0, 1)$
Dann ist die Zufallsvariable (Y), definiert als: $Y = \sum_{i=1}^{k} X_i^2$
chi-quadrat-verteilt mit $k$ Freiheitsgraden. Hierbei sind die Freiheitsgrade $(k)$ eine wichtige Größe, die die Form der Verteilung beeinflusst.
Nichtnegative Werte:
- Die Chi-Quadrat-Verteilung kann nur nichtnegative Werte annehmen (d.h., sie ist immer größer oder gleich null). Dies liegt daran, dass sie auf der Summe von quadrierten Normalverteilungen basiert, die per Definition nicht negativ sind.
Additivität:
- Ein herausragendes Merkmal der Chi-Quadrat-Verteilung ist ihre Additivität. Wenn zwei unabhängige Chi-Quadrat-verteilte Zufallsvariablen addiert werden, ergibt die Summe ebenfalls eine Chi-Quadrat-verteilte Zufallsvariable, deren Freiheitsgrade die Summe der Freiheitsgrade der beiden ursprünglichen Variablen ist. Zum Beispiel, wenn X eine Chi-Quadrat-Verteilung mit df1 Freiheitsgraden hat und Y eine Chi-Quadrat-Verteilung mit df2 Freiheitsgraden hat, dann hat X + Y eine Chi-Quadrat-Verteilung mit (df1 + df2) Freiheitsgraden.
Form der Chi Quadrat Verteilung:
- Die Form der Chi Quadrat Verteilung hängt von der Anzahl der Freiheitsgrade ab. Für kleine Freiheitsgrade ist die Verteilung stark asymmetrisch und schief, während sie mit zunehmenden Freiheitsgraden symmetrischer wird und sich der Normalverteilung annähert.
- Die Verteilungsfunktion verschiebt sich nach rechts und flacht ab, wenn die Freiheitsgrade zunehmen. Dies bedeutet, dass die Wahrscheinlichkeit höherer Werte größer wird.
Erwartungswert und Varianz:
- Der Erwartungswert (Mittelwert) einer Chi Quadrat Verteilung ist gleich der Anzahl der Freiheitsgrade $(k)$. Dies bedeutet, dass der durchschnittliche Wert, den man bei vielen Wiederholungen eines Experiments erwarten kann, gleich $k$ ist.
$\text{Erwartungswert} = k$
- Die Varianz der Chi Quadrat Verteilung ist doppelt so groß wie die Anzahl der Freiheitsgrade:
$\text{Varianz} = 2k$
Die Varianz beschreibt, wie stark die Werte um den Mittelwert streuen.
Dichtefunktion:
- Die Wahrscheinlichkeitsdichtefunktion (PDF) der Chi Quadrat Verteilung mit $k$ Freiheitsgraden ist gegeben durch:
$
f(x; k) = \frac{1}{2^{k/2} \Gamma(k/2)} x^{k/2-1} e^{-x/2} \quad \text{für} \quad x \geq 0
$
Hierbei ist $\Gamma$ die Gammafunktion, eine Erweiterung der Fakultätsfunktion auf reelle Zahlen. Die Dichtefunktion gibt die Wahrscheinlichkeit an, dass eine Zufallsvariable einen bestimmten Wert annimmt.
Anwendungsgebiete:
- Unabhängigkeitstests: Die Chi Quadrat Verteilung wird verwendet, um zu testen, ob zwei kategoriale Variablen unabhängig voneinander sind. Dies wird oft in Kontingenztafeln angewendet.
- Anpassungstests: Sie wird auch verwendet, um zu testen, ob eine beobachtete Häufigkeitsverteilung mit einer theoretischen Verteilung übereinstimmt, wie z.B. beim Chi Quadrat Anpassungstest.
Beispiel:
- Angenommen, wir haben eine Zufallsstichprobe von 10 standardnormalverteilten Zufallsvariablen. Wir berechnen die Summe der Quadrate dieser 10 Variablen. Diese Summe ist dann chi-quadrat-verteilt mit 10 Freiheitsgraden.
Fazit
Die Chi Quadrat Verteilung ist ein zentrales Werkzeug in der Statistik, besonders nützlich für Hypothesentests bezüglich der Varianz und für die Analyse von Kontingenztafeln.