{"id":139,"date":"2009-11-25T12:26:15","date_gmt":"2009-11-25T11:26:15","guid":{"rendered":"http:\/\/blog-conny-dethloff.de\/?p=139"},"modified":"2012-11-28T08:16:15","modified_gmt":"2012-11-28T07:16:15","slug":"falschen-oder-misverstehen-von-statistiken-durch-aggregationsfehler","status":"publish","type":"post","link":"https:\/\/blog-conny-dethloff.de\/?p=139","title":{"rendered":"F\u00e4lschen oder Mi\u00dfverstehen von Statistiken durch Aggregationsfehler"},"content":{"rendered":"
Sehr h\u00e4ufig wird man mit statistischen Auswertungen konfrontiert – egal ob im privaten oder im beruflichen Bereich. Auf Basis dieser Auswertungen m\u00fcssen Entscheidungen getroffen werden. Daf\u00fcr ist es von essentieller Bedeutung diese Auswertungen richtig zu deuten und zu bewerten. Im Zuge der Diskussion des Impfens oder Nichtimpfens gegen Schweinegrippe habe ich mir mal ein solches Beispiel herausgesucht, um zu verdeutlichen was ich meine.<\/p>\n
<\/a><\/p>\n In diesem Beispiel werden zwei Impfstoffe auf Nebenwirkungen bei M\u00e4nner und Frauen getestet. Im linken Schaubild ist das originale Testergebnis dargestellt. Man erkennt das der Impfstoff A bei M\u00e4nnern (0,15% vs. 0,20%) und auch bei den Frauen (0,50% vs. 1,00%) weniger Nebenwirkungen erzeugt. Aggregiert man aber die Testreihen und stellt diese dann \u00fcbergreifend f\u00fcr M\u00e4nner und Frauen dar, erzeugt der Impfstoff B weniger Nebenwirkungen als Impfstoff A (0,22% vs. 0,23%). Das ist falsch. Aber richtig gerechnet ohne die Datenbasis zu manipulieren. Wie ist das m\u00f6glich?<\/p>\n Bei Impfstoff B wurde eine unterschiedliche Datenbasis herangezogen, wodurch die Einzelergebnisse mit einer unterschiedlichen Gewichtung in das Gesamtergebnis einflie\u00dfen. Da man hier nicht von einer Gleichverteilung ausgehen kann, darf man deshalb nicht aggregieren. Im rechten Schaubild habe ich f\u00fcr den Test des Impfstoffes B die gleiche Datenbasis wie f\u00fcr Impfstoff A genommen und die Nebenwirkungen entsprechend der Raten angepa\u00dft. Man erh\u00e4lt eine richtige Aussage: Der Impfstoff B ist gef\u00e4hrlicher als Impfstoff A (0,38% vs. 0,23%). Dieses Ph\u00e4nomen ist auch als Simpson-Paradoxon bekannt.<\/p>\n Also: Immer vorsichtig beim Bewerten von statistischen Aussagen. F\u00fcr weitere Details und Beispiele verweise ich gerne auf das Buch von Prof. Dr. Gerd Gigerenzer<\/em><\/strong> Das Einmaleins der Skepsis: \u00dcber den richtigen Umgang mit Zahlen und Risiken.<\/a><\/p><\/blockquote>\n