Ich nehme an, mit »Korrelationskoeffizient« ist Pearsons r gemeint. (Eigentlich hört dieses Zusammenhangsmaß auf den Namen Produkt-Moment-Korrelationskoeffzient.) Pearsons r ist in Bezug auf die Bestimmung einer Regressionsgeraden definiert. Angenommen, ich habe zwei metrische Variablen [1], die sich in einem Scatterdiagramm U-förmig verteilen. Dann kann ich auf keine vernüftige Weise eine Gerade so durch die Punktewolke ziehen, dass die Gerade genau diesen U-förmigen Zusammenhang zwischen den beiden Variablen irgendwie wiedergibt. Deshalb ist dann Pearsons r gleich Null oder in der Nähe von Null.
Wenn ich mir aber das Scatterdiagramm anschaue und die U-förmige Punktewolke sehe, dann könnte ich schon auf die Idee kommen, dass ich besser versuche, nicht eine Geradengleichung, sondern zum Beispiel eine quadratische Funnktion zu suchen, deren Parabel sich möglichst gut an die Punktewolke anpasst. Wenn ich so etwas versuche, werde ich sehr wahrscheinlich sehr viel höhere Ausprägungen von Pearsons r bekommen als im linearen Fall. Das nennt sich dann Kurvenanpassung. SPSS bietet verschiedene Modelle dafür an, wie hier zu sehen ist:
Quelle: Bühl 2012:489
(Warum das Foto querliegend importiert wird, weiß ich nicht.)
Es gibt aber noch ein weiteres Problem. Es könnte nämlich sein, dass eine oder mehrere Drittvariablen einen an sich vorhandenen Zusammenhang zwischen unseren beiden metrischen Variablen soweit stören, dass er nicht mehr sichtbar ist.
Der umgekehrte Fall einer Scheinkorrelation, die auf dem Einfluss einer Drittvariablen beruht, ist bekannter. Ein immer wieder zitiertes Beispiel ist die signifikante Korrelation, die zwischen der Anzahl von Störchen in einem Gebiet und der Geburtenrate dieses Gebiets gibt. Auf dem Lande gibt es mehr Störche als in der Stadt. Gleichzeitig ist in ländlichen Gebieten die Geburtenrate höher.
So ein Einfluss einer Drittvariablen mag jetzt auch in umgekehrter Richtung wirken. Deshalb ist es immer wichtig, sich über den möglichen Einfluss von Drittvariablen Gedanken zu machen.
Außerdem sollte klar sein, dass statistische Korrelation, auch wenn sie signifikant ist, noch kein Kausalzusammenhang ist. Das Quadrat von Pearsons r, also r², heißt Determinationskoeffizient. Der Determinationskoeffizient sagt etwas darüber, welcher Anteil der Varianz der abhängigen Variablen (y) durch die unabhängige Variable (x) »erklärt« werden kann. Bei einem r von 0,7 ist das etwa die Hälfte der Varianz (genauer 49 Prozent, r² liegt dann bei 0,49). Nur ist der Determinationskoeffizient symmetrisch. Das heißt, es werden dann nicht nur 49 Prozent der Varianz der abhängen von der unabhängigen Variablen »erklärt«, sondern eben auch 49 Prozent der Varianz der unabhängigen Variablen durch die abhängige. Eine Korrelation zwischen Orten, an denen es brennt und Orten, an denen Feuerwehrleute zugegen sind, sagt eben nichts darüber aus, ob die Brände die Ursache für die Anwesenheit der Feuerwehrleute oder die Anwesenheit der Feuerwehrleute die Ursache für die Brände ist.
Viele Grüße
jake2042
[1]
»Metrisch« heißt »mindestens intervallskaliert«. Sind die Skalennieveaus klar?
Literatur
Bühl, Achim, (13)2012: SPSS 20. Einführung in die moderne Datenanalyse. (= scientific tools 4150) München: Pearson