Inhaltsverzeichnis
Einführung in die Statistik — Inhaltsverzeichnis
Hauptseite

Empirische Regressionslinien
Elementare Regression
Korrelation

Elementare Regression

Einführung in die Regression
Die Regression ist eine statistische Methode, die verwendet wird, um die Beziehung zwischen zwei oder mehr Variablen zu modellieren. Im Kontext der elementaren Regression betrachten wir speziell den linearen Zusammenhang zwischen einer abhängigen Variable (oft als $Y$ bezeichnet) und einer unabhängigen Variable (oft als $X$ bezeichnet).

Grundbegriffe und Notationen

Lineares Regressionsmodell
Das einfachste Regressionsmodell ist das lineare Modell, das die Beziehung zwischen $X$ und $Y$ durch eine gerade Linie beschreibt. Mathematisch wird diese Beziehung durch die Gleichung

$Y = \beta_0 + \beta_1 X + \varepsilon$

dargestellt. Hierbei bedeuten:

Schätzung der Regressionsparameter
Die Parameter $\beta_0$ und $\beta_1$ werden durch die Methode der kleinsten Quadrate (Least Squares) geschätzt. Diese Methode minimiert die Summe der quadrierten Abstände (Residuen) zwischen den beobachteten Werten und den vorhergesagten Werten. Die Formeln für die Schätzung dieser Parameter sind:

$\hat{\beta_1} = \frac{\sum (X_i - \bar{X})(Y_i - \bar{Y})}{\sum (X_i - \bar{X})^2}$

$\hat{\beta_0} = \bar{Y} - \hat{\beta_1} \bar{X}$

Dabei sind:

Interpretation der Regressionsparameter

Vorhersagen mit dem Regressionsmodell
Nachdem die Regressionsparameter geschätzt wurden, kann das Modell verwendet werden, um Vorhersagen zu machen. Für einen gegebenen Wert von $X$, wird der vorhergesagte Wert von $Y$ durch die Gleichung

$\hat{Y} = \hat{\beta_0} + \hat{\beta_1} X$

bestimmt. Hierbei ist $\hat{Y}$ der vorhergesagte Wert von $Y$.

Güte der Anpassung
Die Güte der Anpassung eines Regressionsmodells wird oft durch das Bestimmtheitsmaß $R^{2}$ bewertet. Dieses Maß gibt den Anteil der Gesamtvarianz in $Y$ an, der durch $X$ erklärt wird. Es wird berechnet als

$R^2 = 1 - \frac{\sum (Y_i - \hat{Y}_i)^2}{\sum (Y_i - \bar{Y})^2}$

Ein $R^{2}$-Wert von 1 bedeutet, dass das Modell die Daten perfekt erklärt, während ein Wert von 0 bedeutet, dass das Modell keine Erklärungskraft hat.

Annahmen der linearen Regression
Damit die Ergebnisse der linearen Regression zuverlässig sind, müssen bestimmte Annahmen erfüllt sein:


Impressum
Datenschutz

annehmen ablehnen

Auf dieser Website werden Cookies und Pixel-Tags verwendet. Durch die Nutzung dieser Website erklären Sie sich mit der Verwendung von Cookies einverstanden. Mehr zum Thema Cookies und siehe auch Datenschutz