Glossar

Regression

Das Ziel einer Regressionsanalyse ist es, eine mathematische Gleichung herzuleiten, die den Zusammenhang zwischen einer Zielgröße und einer oder mehrerer Einflussgrößen optimal beschreibt. Dies ermöglicht es unter anderem, Vorhersagen anhand der Einflussgröße(n) auf die Zielgröße abzuleiten.

Die Skalierung und Verteilung der zu analysierenden Parameter gibt dabei das Regressionsverfahren vor.

Die Regression zweier quantitativer Messreihen lässt sich (falls eine Abhängigkeit besteht) durch eine lineare Gleichung y=ax+b mit der Steigung a und dem Achsenabschnitt b darstellen. Aufgrund sachlogischer Überlegungen sollte vorab geklärt werden, welcher der beiden Parameter sinnvollerweise als unabhängig und welcher als abhängig angenommen wird. Je nach Verteilung stehen verschiedene Verfahren zur Berechnung dieser Gleichung zur Verfügung. Sind die Messreihen annähernd normalverteilt, so lässt sich eine lineare Regression rechnen, um die Regressionskoeffizienten a und b zu bestimmen, im nicht-parametrischen Fall steht hier die Passing-Bablok-Regresssion zur Verfügung. Bei der linearen Regression können zudem mehrere Einflussgrößen berücksichtigt werden, wobei nur die im Modell Verwendung finden, die eine Vorhersage auf die Zielgröße ermöglichen.

Ein weiteres Regressionsmodell ist die binär logistische Regression, bei der die Zielgröße ein dichotomes Skalenniveau aufweist (Ereignis liegt vor vs. Ereignis liegt nicht vor). Auch hier können verschiedene Einflussfaktoren (quantitativ oder qualitativ) hinsichtlich ihrer Prognoseeigenschaft geprüft werden. Das mathematische Modell, welches mit dieser Analyse ermittelt wird, gibt die Wahrscheinlichkeit für das Eintreten des hier betrachteten Ereignisses an. Eine Erweiterung dieses Ansatzes liefert die multinomiale logistische Regression (mit Referenzkategorie), bei der die Zielgröße aus mehr als zwei nominal skalierten Ausprägungen besteht.

Die Cox-Regression eignet sich für Ereigniszeitanalysen (z.B. Überlebenszeitanalysen). Die Zielgröße ist hier die Zeit bis zum Eintreten eines betrachteten Ereignisses (Tod bei der Überlebenszeitanalyse). Anhand eines mathematischen Modells (einer Gleichung) aus einer oder mehreren qualitativen oder quantitativen Einflussgrößen wird hier die Hazard-Rate (Sterberate zu einem Zeitpunkt) vorhergesagt. Das hier verwendete Modell ist das Cox-Proportional-Hazard-Modell.

Die oben aufgeführten Verfahren finden häufig Einsatz in der medizinischen Statistik, es gibt jedoch noch eine Vielzahl weiterer Regressionsansätze auf die an dieser Stelle nicht weiter eingegangen werden soll. Das Prinzip, das allen zugrunde liegt, ist immer die Vorhersage einer Zielgröße anhand von Einflussfaktoren.

Zurück zur Übersicht

Referenzen

Hier finden Sie einen Auszug unserer bisherigen Projekte und Auftraggeber

Zum Glossar

Hier finden Sie Erläuterungen zu diversen biostatistischen Fachbegriffen