Einführung
In der Statistik dienen Streuungsmaße dazu, die Verteilung und die Variabilität von Daten zu quantifizieren. Zwei der wichtigsten Streuungsmaße sind die Varianz und die Standardabweichung. Beide Maße geben an, wie stark die einzelnen Datenwerte um den Mittelwert (durchschnittlichen Wert) streuen.
Varianz
Die Varianz (σ²) ist ein Maß dafür, wie weit die einzelnen Beobachtungswerte einer Datenreihe im Durchschnitt vom Mittelwert entfernt sind. Sie berechnet sich als der Durchschnitt der quadrierten Abweichungen der Werte vom Mittelwert.
Berechnung der Varianz
Um die Varianz einer Datenreihe zu berechnen, folgen diese Schritte:
Mittelwert berechnen: Der Mittelwert (arithmetisches Mittel) einer Datenreihe ist die Summe aller Werte geteilt durch die Anzahl der Werte.
$\text{Mittelwert} (\mu) = \frac{1}{N} \sum_{i=1}^{N} x_i$
wobei $x_i$ die einzelnen Datenwerte und $N$ die Anzahl der Werte sind.
Abweichungen vom Mittelwert berechnen: Für jeden Datenwert wird die Differenz zwischen dem Wert und dem Mittelwert berechnet.
$\text{Abweichung} = x_i - \mu$
Abweichungen quadrieren: Jede dieser Abweichungen wird quadriert, um negative Werte zu eliminieren und größere Abweichungen stärker zu gewichten.
$(\text{Abweichung})^2 = (x_i - \mu)^2$
Durchschnitt der quadrierten Abweichungen berechnen: Die quadrierten Abweichungen werden summiert und durch die Anzahl der Werte geteilt, um die Varianz zu erhalten.
$\text{Varianz} (\sigma^2) = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2$
Standardabweichung
Die Standardabweichung (σ) ist das positive Quadratwurzel der Varianz. Sie gibt die durchschnittliche Abweichung der Datenwerte vom Mittelwert in der ursprünglichen Maßeinheit der Daten an, was sie leichter interpretierbar macht.
Berechnung der Standardabweichung
Um die Standardabweichung zu berechnen, wird einfach die Quadratwurzel der Varianz genommen:
$\text{Standardabweichung} (\sigma) = \sqrt{\text{Varianz} (\sigma^2)}$
Beispiel
Betrachten wir ein einfaches Beispiel mit einer kleinen Datenreihe: 2, 4, 4, 4, 5, 5, 7, 9.
Mittelwert berechnen:
$\mu = \frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5$
Abweichungen vom Mittelwert und ihre Quadrate:
$ \begin{align} (2 - 5)^2 & = (-3)^2 = 9 \\ (4 - 5)^2 & = (-1)^2 = 1 \\ (4 - 5)^2 & = (-1)^2 = 1 \\ (4 - 5)^2 & = (-1)^2 = 1 \\ (5 - 5)^2 & = 0^2 = 0 \\ (5 - 5)^2 & = 0^2 = 0 \\ (7 - 5)^2 & = 2^2 = 4 \\ (9 - 5)^2 & = 4^2 = 16 \\ \end{align} $
Varianz berechnen:
$ \sigma^2 = \frac{9 + 1 + 1 + 1 + 0 + 0 + 4 + 16}{8} = \frac{32}{8} = 4 $
Standardabweichung berechnen:
$ \sigma = \sqrt{4} = 2 $
Interpretation
Die Varianz (4) gibt an, dass die Datenwerte im Durchschnitt eine quadrierte Abweichung von 4 vom Mittelwert haben. Die Standardabweichung (2) zeigt, dass die Datenwerte im Durchschnitt um 2 Einheiten vom Mittelwert abweichen.
Anwendung und Bedeutung
Varianz und Standardabweichung sind fundamentale Konzepte in der Statistik und werden in zahlreichen Bereichen angewendet, einschließlich Wirtschaft, Naturwissenschaften und Sozialwissenschaften. Sie helfen, die Verteilung der Daten zu verstehen und ermöglichen den Vergleich der Streuung zwischen verschiedenen Datensätzen.
Die Kenntnis dieser Maße ist wichtig, um die Variabilität in den Daten zu quantifizieren und um fundierte Entscheidungen basierend auf der Analyse der Daten zu treffen.