Unstatistik: Unfugs-Korrelation zwischen Impfquote und Übersterblichkeit

Eine Studie findet, dass für den Zeitraum zwischen der 36. und 40. Kalenderwoche zwischen der Übersterblichkeit in den Bundesländern und deren Impfquote eine positive Korrelation (0,31) vorliegt, obwohl man eine negative Korrelation erwarten würde. Oder, mit den Worten der Autoren der Studie: „Je höher die Impfquote, desto höher die Übersterblichkeit“.

Zitierweise: HAUT 2022;33(1):54.

Zwar haben sich die Autoren von der Studie inzwischen bereits distanziert. Auch haben mehrere Faktenchecks, unter anderem vom MDR und der Tagesschau, einige Probleme der Studie aufgezeigt. Sie haben jedoch einige zentrale Schwächen der Studie übersehen. 

Die Korrelation ist nicht robust ...

Die Autoren haben für die Kalenderwochen 36 bis 40 (6.9. bis 10.10.2021) die Sterbefallzahlen für die einzelnen Bundesländer genommen und mit den jeweils mittleren Sterbefallzahlen derselben Kalenderwochen für die Jahre 2016 bis 2020 verglichen. Der Quotient der Zahlen für 2021 und der entsprechenden Durchschnitte des Zeitraums von 2016 bis 2020 wird als Übersterblichkeit interpretiert: Ist der Quotient höher als 1, sind 2021 mehr Personen gestorben, als zu erwarten war; ist der Quotient kleiner als 1, sind 2021 weniger Personen gestorben, als zu erwarten war. In einem zweiten Schritt haben die Autoren schließlich die Korrelation zwischen dieser Übersterblichkeit und der Impfquote in der Kalenderwoche 40 berechnet (zumindest gehen wir davon aus, da die Autoren die Informationen von der Seite des RKI bezogen haben und dort nur der jeweils letzte Stand der Impfquote ausgewiesen wird). Dabei wird über eine Gewichtung die unterschiedliche Bevölkerungsgröße der Bundesländer berücksichtigt.

Wenn wir diese Analyse wiederholen, erhalten wir dasselbe Ergebnis: Zwischen der Impfquote und der Übersterblichkeit ergibt sich eine positive Korrelation von 0,31 bei einem möglichen Wertebereich zwischen 0 und 1. Aber diese Korrelation ist im statistischen Sinne nicht signifikant. Man kann nicht ablehnen, dass sie Null ist, also nur ein rein zufälliges Muster zwischen Impfquote und der Übersterblichkeit sichtbar wird, das auf zufälligen Schwankungen der zugrunde liegenden Daten beruht. Welche Auswirkungen das hat, lässt sich leicht sichtbar machen, indem man andere Kalenderwochen betrachtet. Denn man kann sich fragen, warum man ausgerechnet die Kalenderwochen 36 bis 40 untersucht. Gut – wiederholen wir die Analyse für die Kalenderwochen 20 bis 40. Ergebnis: Ebenfalls eine positive Korrelation, wenn auch nur halb so hoch (0,14) und ebenfalls nicht statistisch signifikant. Nehmen wir neuere Daten hinzu und analysieren die Kalenderwochen 36 bis 44, ergibt sich eine negative Korrelation (-0,37), ebenfalls nicht signifikant. Fazit: Die Ergebnisse sind alles andere als robust – wenn man aus dieser Analyse etwas folgern möchte, dann dass zwischen der Impfquote und der Übersterblichkeit keine Korrelation existiert.

… und zeigt keine Kausalität

Doch selbst wenn man eine signifikant positive Korrelation finden würde, wäre dies eben nur eine Korrelation und könnte mindestens aus zwei Gründen nicht kausal interpretiert werden. Zum einen verwenden die Autoren die in der 40. Kalenderwoche realisierte Impfquote der einzelnen Bundesländer. Und die soll die Übersterblichkeit in den Wochen vorher erklären? Wenn heute in Deutschland ein Meteorit einschlägt, lassen sich damit auch nicht die Sterberaten von vor zwei Wochen erklären. Zum zweiten dürfte die Kausalitätsrichtung wohl in die andere Richtung gehen: Wer heute noch nicht geimpft ist und Nachrichten über steigende Todesfälle durch COVID-19 liest, der wird sich womöglich doch schnell impfen lassen. Alsonicht„Je höher die Impfquote, desto höher die Übersterblichkeit“,sondern:„Je höher die Übersterblichkeit, desto höher die Impfquote.“

Übersterblichkeit: viele Ursachen

Und schließlich ist die Verwendung der „Übersterblichkeit“ als Messgröße für die Schwere der Pandemie sehr fraglich. Für diese Übersterblichkeit können viele Faktoren ursächlich sein, nicht nur die Pandemie. Nehmen wir daher einmal einen Indikator, der die Folgen der Pandemie direkter erfasst: Die vom RKI ausgewiesene 7-Tage-Hospitalisierungsinzidenz (also die ins Krankenhaus eingewiesenen COVID-19-Fälle unter den in den zurückliegenden 7 Tagen gemeldeten COVID-Fällen je 100.000 Personen). Berechnet man wie oben die Korrelation zwischen der Impfquote und der 7-Tage-Hospitalisierungsinzidenz, ergibt sich ein robustes und sehr eindeutiges Ergebnis: Für die Kalenderwochen 36 bis 40 sowie 20 bis 40 ergibt sich eine signifikant negative Korrelation von -0,63. Erweitert man die Analyse auf die Kalenderwochen 36 bis 44, steigt die Korrelation auf -0,75. Auch dies ist nur eine Korrelation und keine kausale Beziehung. Aber sie ist robust und praktisch nicht mehr durch Zufall zu erklären.

Quelle: RWI – Leibniz-Institut für ­Wirtschaftsforschung e.V.