Satz von Bayes
Der Satz von Bayes ist einer der wichtigsten Sätze der Wahrscheinlichkeitrechnung. Er besagt, dass ein Verhältnis zwischen der bedingten Wahrscheinlichkeit zweier Ereignisse P(A | B) und der umgekehrten Form P(B | A) besteht.
Für zwei Ereignisse A und B, für B ≠ 0, lautet das Satz von Bayes:
- P(A | B) ist die (bedingte) Wahrscheinlichkeit des Ereignisses A unter der Bedingung, dass B eingetreten ist
- P(B | A) ist die (bedingte) Wahrscheinlichkeit des Ereignisses B unter der Bedingung, dass A eingetreten ist
- P(A) ist die Wahrscheinlichkeit (Anfangswahrscheinlichkeit) für das Eintreten des Ereignisses A
- P(B) ist die Wahrscheinlichkeit (Anfangswahrscheinlichkeit) für das Eintreten des Ereignisses B
Anfangswahrscheinlichkeit meint, dass ein Ereignis unabhängig von einem anderen betrachtet wird.
Beispiel 1
Ein Beispiel aus der Ausgabe der New York Times vom 5. August 2011 (frei zitiert):
Gehen Sie davon aus, dass man Ihnen drei Münzen gibt: Zwei von ihnen sind fair (50:50 nach Laplace) und eine ist manipuliert. Diese landet immer mit Kopf nach oben. Sie wählen eine der drei Münzen zufällig aus, die Wahrscheinlichkeit, dass es sich dabei um die manipulierte handelt, ist 1/3. Dies ist die vorherige Wahrscheinlichkeit der Hypothese, dass es sich um die manipulierte Münze handelt. Nun wählen wir eine Münze zufällig aus und werfen sie drei Mal. Wir stellen fest, dass die Münze jedes Mal Kopf gezeigt hat. Mit diesen neuen Erkenntnissen, wollen wir nun wissen, ob die vorherige Wahrscheinlichkeit, ob es sich um eine manipulierte Münze handelt, noch 1/3 ist. Die Antwort auf diese Frage kann mit dem Satz von Bayes beantwortet werden: die Wahrscheinlichkeit, dass es sich bei der Münze um die manipulierte handelt ist nun von 1/3 auf 4/5 gestiegen.
Beispiel 2
Ein Drogentest hat eine Spezifität von 99% und eine Sensitivität von ebenfalls 98,5%. Das bedeutet, dass die Ergebnisse des Test zu 99% für Drogenabhängige korrekt sein wird und zu 98% für Nicht-Drogenabhängige. Wenn wir wissen, dass 0,5% der getesteten Menschen die Droge genommen haben, wie hoch ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person, die positiv geteste wurde, auch tatsächlich die Droge konsumiert hat?
Aus dem Satz von Bayes ergibt sich folgendes:
(‚+‘ gibt an, dass der Test positiv ausgefallen war, ‚-‚, dass er negativ war)
Trotz der scheinbar sehr hohen Genauigkeit des Tests, ist die Wahrscheinlichkeit höher, dass jemand der positiv getestet wurde, die Droge nicht konsumiert hat (≈ 75%).
Erklärung
Dieses überraschende Ergebnis kommt zustande, da die Anzahl der Nicht-Drogenabhängigen im Verhältnis zu den Drogenabhängigen sehr groß ist. Die Wahrscheinlichkeit für ein falsch positives Ergebnis (Person ist nicht drogenabhängig, aber Test ist positiv) übersteigt mit 1,4925% die Wahrscheinlichkeit für ein korrektes Ergebnis (Person ist drogenabhängig, und Test ist positiv) (0,495%). Um das Ganze mit Zahlen zu veranschaulichen: Wenn 1000 Personen getestet werden, würden wir statistisch 5 Drogenabhängige und 995 Nicht-Drogenabhängige erwarten. Von den 995 erwarten wir, das ca. 15 (995 · 1,5% = 14,925 ≈ 15) positiv gestestet werden (falsch positives Testergebnis). Von den 5 Drogenabhängigen erwarten wir, dass alle (5 · 99% = 4,95 ≈ 5) positiv getestet werden. Aus den insgesamt 20 positiv Getesteten sind allerdings nur 5 tatsächlich drogenabhängig, daher knapp 25%.
Herleitung
Der Satz von Bayes kann aus der Formel für bedingte Wahrscheinlichkeit hergeleitet werden:
Satz von Bayes anschaulich und interaktiv
{Bayes}