Korrelation ≠ Kausalität — Wenn Zusammenhänge trügen
Warum zwei Dinge, die zusammengehen, sich nicht gegenseitig verursachen müssen. Mit klassischen Beispielen, Erklärvideo und Diskussion.
- Sie können den Unterschied zwischen Korrelation und Kausalität anhand von Beispielen erklären.Verstehen
- Sie können Scheinkorrelationen erkennen und die zugrundeliegende Drittvariable identifizieren.Analysieren
- Sie können beurteilen, ob ein statistischer Zusammenhang in einem konkreten Fall kausal ist oder nicht.Evaluieren
Wussten Sie, dass der Konsum von Mozzarella-Käse stark mit der Vergabe von Ingenieurspatenten korreliert? In diesem Modul lernen Sie, warum Korrelation nicht Kausalität bedeutet — und warum das einer der wichtigsten Sätze der Statistik ist.
Mit klassischen Beispielen (Störche & Babys, Eiscreme & Badeunfälle), einem Erklärvideo von AlgorithmWatch und praktischen Analyse-Aufträgen.
Note
Einstieg: Wenn Zahlen lügen
Wussten Sie, dass die Anzahl der Nicholas-Cage-Filme stark mit der Anzahl der Ertrinkungsunfälle in Schwimmbecken korreliert? Oder dass der Konsum von Mozzarella-Käse mit der Vergabe von Ingenieurspatenten zusammenhängt?
Das sind keine Scherze — diese Korrelationen sind real und messbar. Aber was bedeuten sie wirklich?
Besuchen Sie tylervigen.com und schauen Sie sich 2-3 Beispiele an. Was fällt Ihnen auf?
Nach dem Video: Beschreiben Sie in 2-3 Sätzen den Unterschied zwischen Korrelation und Kausalität. Nennen Sie je ein eigenes Beispiel.
Korrelation vs. Kausalität — was ist der Unterschied?
Korrelation bedeutet: Zwei Variablen verändern sich gemeinsam. Wenn die eine steigt, steigt (oder sinkt) die andere ebenfalls. Man misst die Stärke mit dem Korrelationskoeffizienten r:
- r = +1: perfekte positive Korrelation (beide steigen zusammen)
- r = -1: perfekte negative Korrelation (eine steigt, andere sinkt)
- r ≈ 0: kein messbarer Zusammenhang
Kausalität (Ursächlichkeit) bedeutet: Eine Variable verursacht direkt die Änderung der anderen. Es gibt einen erkennbaren Wirkmechanismus.
Die goldene Regel: Korrelation ist eine notwendige, aber keine hinreichende Bedingung für Kausalität. Korrelation ≠ Kausalität.
Vier Gründe, warum Korrelation täuscht
Wenn zwei Variablen korrelieren, kann das vier verschiedene Gründe haben:
- Konfundierende Variable (Drittvariable): Eine versteckte dritte Variable beeinflusst beide. Beispiel: Eisverkauf und Badeunfälle korrelieren — die Drittvariable ist Sommertemperatur.
- Reverse Causation (umgekehrte Wirkrichtung): Die Wirkrichtung ist andersherum als angenommen. Beispiel: Führt schlechter Schlaf zu Stress — oder verursacht Stress schlechten Schlaf?
- Zufall (Spurious Correlation): Bei genügend vielen Variablen finden sich rein zufällig Zusammenhänge. Vgl. tylervigen.com.
- Selektionseffekt: Die Stichprobenauswahl erzeugt einen künstlichen Zusammenhang. Beispiel: Eine Umfrage unter Büchereibesuchern "beweist", dass Lesen Bildung fördert — aber wer in die Bücherei geht, ist ohnehin gebildeter.
Klassische Beispiele
Diese Beispiele zeigen Scheinkorrelationen — alle sind messbar, aber keine ist kausal:
| Beobachtete Korrelation | Schluss nahelegt | Tatsächliche Ursache (Drittvariable) |
|---|---|---|
| Mehr Störche → mehr Geburten | Störche bringen Babys? | Beide hängen mit ländlichen Regionen zusammen |
| Mehr Eisverkauf → mehr Ertrinken | Eis macht waghalsig? | Sommer/Hitze erhöht beides |
| Grössere Schuhe → besseres Lesen | Grosse Füsse = schlau? | Alter (ältere Kinder haben grössere Schuhe und lesen besser) |
| Mehr Feuerwehrleute → mehr Schaden | Feuerwehr macht es schlimmer? | Grösse des Brandes bestimmt beides |
Drittvariable finden: Der Zusammenhang «mehr Eisverkauf → mehr Ertrinkungsfälle» ist messbar. Was ist die Drittvariable? Erklären Sie, wie sie beide Variablen beeinflusst.
Störche und Babys: Der Zusammenhang «mehr Störche → mehr Geburten» ist statistisch nachweisbar. Was ist die tatsächliche Ursache? Erklären Sie den Mechanismus.
Checklist
Transfer: Social-Media-Algorithmen
"Personen, die X sahen, sahen auch Y." — Diese Art von Empfehlung begegnet uns täglich auf Netflix, YouTube, Amazon und TikTok.
Aber Vorsicht: Empfehlungsalgorithmen basieren auf Korrelationen, nicht auf Kausalitäten. Der Algorithmus erkennt ein Muster ("Nutzer, die A mochten, mochten auch B"), aber er versteht nicht, warum.
Das Problem: Wenn der Algorithmus fälschlicherweise kausale Zusammenhänge annimmt, kann das zu Filter Bubbles führen — Nutzer bekommen nur noch Inhalte, die das System für "passend" hält, und andere Perspektiven fallen weg.
Medienbeispiel: Finden Sie ein Beispiel aus den Medien, bei dem eine Korrelation als Kausalität dargestellt wird (z.B. «Studie zeigt: Schokolade macht glücklich»). Beschreiben Sie die Aussage und Ihre Kritik daran.
Challenge
Auftrag: Scheinkorrelationen finden
Besuchen Sie tylervigen.com/spurious-correlations und wählen Sie eine Scheinkorrelation aus, die Sie besonders absurd finden.
Halten Sie schriftlich fest:
- Welche zwei Variablen korrelieren?
- Wie hoch ist der Korrelationskoeffizient?
- Warum ist der Zusammenhang absurd? Gibt es eine plausible Drittvariable — oder ist es reiner Zufall?
Reflection
Reflexion
Nehmen Sie sich einen Moment Zeit und überlegen Sie:
- Wo sind Sie schon einmal einer Scheinkorrelation "aufgesessen" — in den Medien, in der Werbung, in Gesprächen?
- Was ist das Wichtigste, das Sie aus diesem Modul mitnehmen?
- Wie werden Sie in Zukunft Statistiken und Behauptungen über Zusammenhänge kritischer prüfen?
Quellen & Attribution
- AlgorithmWatch erklärt: Korrelation & Kausalität AlgorithmWatch
- Spurious Correlations Tyler Vigen
- Kausalität und Korrelation: Unterschiede und Beispiele Scribbr