Glossar

Lineare Regression

Eine lineare Regressionsanalyse wird angewendet, um den Zusammenhang zwischen (mindestens) zwei quantitativen Messreihen anhand einer mathematischen Gleichung darzustellen. Dabei gibt es eine vorherzusagende bzw. beeinflusste, abhängige Größe und eine oder auch mehrere einflussnehmende unabhängige Größe(n). Kann keine Ursache-Wirkungsrichtung zugewiesen werden, ist eine Regressionsanalyse nicht zielführend und eher eine Korrelationsanalyse zu empfehlen.

Die Regression zweier quantitativer Messreihen ist im einfachsten Fall eine lineare Gleichung y = ax + b mit der Steigung a und dem Achsenabschnitt b. Sind die Messreihen zumindest annähernd normalverteilt, so lassen sich die Koeffizienten (a und b) der Regressionsgeraden wie folgt berechnen:

Steigung (Regressionskoeffizient): $$ a = \frac{s_{xy}}{s_x^2} $$

Achsenabschnitt: $$ b = \bar{y}-a\bar{x} $$

Dabei ist $ s_{xy}$ die Kovarianz und $ s_x $ die Standardabweichung der x-Werte (unabhängige Größe);

$ \bar{y} $ und $ \bar{x} $ sind die Mittelwerte der Messreihen.

Die hier ermittelte Regressionsgerade liegt so im Streudiagramm aus Wertepaaren, dass das durchschnittliche Abstandsquadrat der Messpunkte von der Geraden minimal ist.

Im Fall, dass es mehrer unabhängige (einflussnehmende) Größen $ x_i $ mit i=(1,..n) gibt, ist eine multiple lineare Regressionsanalyse anzuwenden. Die Regressionsgleichung hat dann die Form: $ y = a_1\cdot x_1 + a_2\cdot x_2 + ..+ a_n\cdot x_n + b $

Zurück zur Übersicht

Referenzen

Hier finden Sie einen Auszug unserer bisherigen Projekte und Auftraggeber

Zum Glossar

Hier finden Sie Erläuterungen zu diversen biostatistischen Fachbegriffen