Eine zweidimensionale Häufigkeitsverteilung befasst sich mit der Verteilung zweier Merkmale in einer Stichprobe. Bedingte Verteilungen sind ein wichtiger Aspekt dieser Verteilungen und bieten Einblicke in die Beziehung zwischen diesen Merkmalen.
Grundlagen der bedingten Verteilungen
Eine bedingte Verteilung beschreibt die Verteilung einer Variable unter der Bedingung, dass die andere Variable einen bestimmten Wert annimmt. Dies bedeutet, dass wir uns nur auf die Fälle konzentrieren, in denen ein bestimmtes Ereignis eingetreten ist, und untersuchen, wie die andere Variable sich verhält.
Beispiel und Notation
Angenommen, wir haben zwei Merkmale:
Wir möchten wissen, wie die Noten $Y$ verteilt sind, wenn die Lernzeit $X$ einen bestimmten Wert hat, z. B. 10 Stunden pro Woche.
Die bedingte Verteilung von $Y$ gegeben $X = 10$ wird als $Y | X = 10$ geschrieben. Dies ist die Verteilung der Noten der Studenten, die genau 10 Stunden pro Woche lernen.
Berechnung der bedingten Verteilung
Um die bedingte Verteilung zu berechnen, verwenden wir die bedingte Wahrscheinlichkeit. Die bedingte Wahrscheinlichkeit $P(Y = y | X = x)$ ist die Wahrscheinlichkeit, dass $Y$ den Wert $y$ annimmt, wenn $X$ den Wert $x$ hat. Diese berechnet sich wie folgt:
$P(Y = y | X = x) = \frac{P(Y = y \text{ und } X = x)}{P(X = x)}$
Hierbei ist:
Beispielhafte Berechnung
Nehmen wir an, wir haben folgende Häufigkeitstabelle, die die Anzahl der Studenten angibt, die eine bestimmte Anzahl von Lernstunden und eine bestimmte Note haben:
Stunden (X) | Note A (Y=1) | Note B (Y=2) | Note C (Y=3) | Summe |
---|---|---|---|---|
5 | 2 | 3 | 1 | 6 |
10 | 1 | 4 | 5 | 10 |
15 | 3 | 2 | 1 | 6 |
Summe | 6 | 9 | 7 | 22 |
Wenn wir die bedingte Verteilung der Noten für Studenten betrachten, die 10 Stunden pro Woche lernen, berechnen wir zunächst die gemeinsamen Wahrscheinlichkeiten und dann die bedingten Wahrscheinlichkeiten.
Die gemeinsame Wahrscheinlichkeit $P(Y = 2 \text{ und } X = 10)$ ist die Anzahl der Studenten mit Note B und 10 Stunden geteilt durch die Gesamtzahl der Studenten:
$P(Y = 2 \text{ und } X = 10) = \frac{4}{22}$
Die Wahrscheinlichkeit, dass ein Student 10 Stunden lernt, ist:
$P(X = 10) = \frac{10}{22}$
Die bedingte Wahrscheinlichkeit, dass ein Student mit 10 Stunden Note B hat, ist:
$P(Y = 2 | X = 10) = \frac{P(Y = 2 \text{ und } X = 10)}{P(X = 10)} = \frac{\frac{4}{22}}{\frac{10}{22}} = \frac{4}{10} = 0.4$
Interpretation
Die bedingte Verteilung hilft uns zu verstehen, wie die Noten der Studenten verteilt sind, abhängig von der Lernzeit. In unserem Beispiel zeigt die bedingte Verteilung, dass 40% der Studenten, die 10 Stunden pro Woche lernen, Note B haben.
Verwendung und Bedeutung
Bedingte Verteilungen sind nützlich, um Abhängigkeiten und Zusammenhänge zwischen Variablen zu analysieren. Sie finden Anwendung in vielen Bereichen, wie der Marktforschung, Medizin, und Sozialwissenschaften. Beispielsweise könnte ein Unternehmen die bedingte Verteilung von Kaufentscheidungen basierend auf demografischen Merkmalen untersuchen, um gezieltere Marketingstrategien zu entwickeln.