Glossar

Korrelationskoeffizient nach Pearson

Der Korrelationskoeffizient nach Perason ist ein dimensionsloses Maß für die Stärke des linearen Zusammenhangs zwischen zwei quantitativen Größen und wird auch als Produkt-Moment-Korrelationskoeffizient oder Maßkorrelationskoeffizient bezeichnet.

Voraussetzungen:

Die zu korrelierenden Größen sind quantitativ.

Beide Größen sind normalverteilt.

Es liegen unabhängige Beobachtungspaare vor.

Der untersuchte Zusammenhang ist linear.

Berechnung:

$$ r = \dfrac{s_{xy}}{s_x * s_y} =\dfrac{\sum_{i=1}^n (x_i - \tilde x)(y_i - \tilde y)}{\sqrt{\sum_{i=1}^n (x_i - \tilde x)^2 \sum_{i=1}^n (y_i - \tilde y)^2}} $$

dabei sind sxy die empirische Kovarianz, sx und sy die empirischen Standardabweichungen, x und y die Mittelwerte der zu korrelierenden Größen X und Y sowie n die Anzahl der Wertepaare (xi,yi).

(Ist nicht zu erwarten, dass ein linearer Zusammenhang besteht oder gibt es in mindestens einer Größe Abweichungen von einer Normalverteilung, so kann alternativ der Korrelationskoeffizient nach Spearman berechnet werden.)

Interpretation:

Ist der Korrelationskoeffizient r > 0, so liegt ein positiver Zusammenhang vor, ist r < 0 so besteht ein negativer Zusammenhang. Kein linearer Zusammenhang liegt vor, wenn r = 0 ist.

Der Korrelationskoeffizient r nimmt Werte zwischen -1 und +1 an. Je dichter r bei 0 liegt, desto schwächer ist der lineare Zusammenhang, je näher r bei -1 oder +1 liegt, desto stärker ist der Zusammenhang:

0,0 ≤ r ≤ 0,2   =>   kein bis geringer linearer Zusammenhang

0,2 < r ≤ 0,5   =>   schwacher bis mäßiger linearer Zusammenhang

0,5 < r ≤ 0,8   =>   deutlicher linearer Zusammenhang

0,8 < r ≤ 1,0   =>   hoher bis perfekter linearer Zusammenhang

Einheitliche Richtlinien zur Bewertung des Korrelationskoeffizienten gibt es in der Literatur nicht, obige ist nur eine von vielen. Die Übergänge sind fließend und man sollte eher den Sachbezug in die Beurteilung des Korrelationskoeffizienten einbeziehen, als an festen Grenzen festzuhalten.

Hinweis:

Der Korrelationskoeffizient liefert keine Informationen zur Ursache-Wirkungs-Beziehung zwischen den untersuchten Merkmalen. Welche von beiden Größen die abhängige und welche die unabhängige ist oder ob sich beide Größen gegenseitig bedingen, wird nicht geklärt. Ebenfalls ungeklärt bleibt, ob evtl. eine Scheinkorrelation vorliegt.

Zurück zur Übersicht

Referenzen

Hier finden Sie einen Auszug unserer bisherigen Projekte und Auftraggeber

Zum Glossar

Hier finden Sie Erläuterungen zu diversen biostatistischen Fachbegriffen