Fälschen oder Mißverstehen von Statistiken durch Aggregationsfehler

Sehr häufig wird man mit statistischen Auswertungen konfrontiert – egal ob im privaten oder im beruflichen Bereich. Auf Basis dieser Auswertungen müssen Entscheidungen getroffen werden. Dafür ist es von essentieller Bedeutung diese Auswertungen richtig zu deuten und zu bewerten. Im Zuge der Diskussion des Impfens oder Nichtimpfens gegen Schweinegrippe habe ich mir mal ein solches Beispiel herausgesucht, um zu verdeutlichen was ich meine.

In diesem Beispiel werden zwei Impfstoffe auf Nebenwirkungen bei Männer und Frauen getestet. Im linken Schaubild ist das originale Testergebnis dargestellt. Man erkennt das der Impfstoff A bei Männern (0,15% vs. 0,20%) und auch bei den Frauen (0,50% vs. 1,00%) weniger Nebenwirkungen erzeugt. Aggregiert man aber die Testreihen und stellt diese dann übergreifend für Männer und Frauen dar, erzeugt der Impfstoff B weniger Nebenwirkungen als Impfstoff A (0,22% vs. 0,23%). Das ist falsch. Aber richtig gerechnet ohne die Datenbasis zu manipulieren. Wie ist das möglich?

Bei Impfstoff B wurde eine unterschiedliche Datenbasis herangezogen, wodurch die Einzelergebnisse mit einer unterschiedlichen Gewichtung in das Gesamtergebnis einfließen. Da man hier nicht von einer Gleichverteilung ausgehen kann, darf man deshalb nicht aggregieren. Im rechten Schaubild habe ich für den Test des Impfstoffes B die gleiche Datenbasis wie für Impfstoff A genommen und die Nebenwirkungen entsprechend der Raten angepaßt. Man erhält eine richtige Aussage: Der Impfstoff B ist gefährlicher als Impfstoff A (0,38% vs. 0,23%). Dieses Phänomen ist auch als Simpson-Paradoxon bekannt.

Also: Immer vorsichtig beim Bewerten von statistischen Aussagen. Für weitere Details und Beispiele verweise ich gerne auf das Buch von Prof. Dr. Gerd Gigerenzer Das Einmaleins der Skepsis: Über den richtigen Umgang mit Zahlen und Risiken.

1 Star2 Stars3 Stars4 Stars5 Stars (Keine Bewertungen bislang. Geben Sie doch die erste ab.)
Loading ... Loading ...
This entry was posted in Denken and tagged , , , , , . Bookmark the permalink.

One Response to Fälschen oder Mißverstehen von Statistiken durch Aggregationsfehler

  1. ecards says:

    Magnificent beat ! I would like to apprentice while you amend your website, how can i subscribe for a blog site? The account helped me a acceptable deal. I had been tiny bit acquainted of this your broadcast offered bright clear concept

Leave a Reply

Your email address will not be published. Required fields are marked *