Hypergeometrische Verteilung
Wenn eine Stichprobe ohne Zurücklegen entnommen wird, liefert die Binomialverteilung nur schlechte Ergebnisse, da die Versuche nicht stochastisch unabhängig voneinander sind. Je kleiner die Menge der Grundgesamtheit, desto ungenauer wird die Binomialverteilung werden.
Sei N die Anzahl der Elemente in der Grundgesamtheit; M die Anzahl der Elemente, die für uns günstig sind; n sei die größe der Stichprobe (daher die Anzahl der Elemente, die wir „entnehmen“ wollen); k die Anzahl der Elemente aus M, die in n enthalten sind. \( \dbinom{n}{k} \) ist der Binomialkoeffizient.
Man kann sich die hypergeometrische Verteilung einfach als Urne vorstellen, bei der Kugeln ohne Zurücklegen entnommen werden. Die Urne enthält allerdings zwei verschiedene Sorten von Kugeln, von denen nur eine für uns interessant ist.
Beispiel: Lotto (6 aus 49)
Wie hoch ist die Wahrscheinlichkeit einen Sechser im Lotto zu bekommen? Wie hoch die Wahrscheinlichkeit für drei Richtige?
Um die Wahrscheinlichkeit für einen Sechser im Lotto zu berechnen, können wir die hypergeometrische Verteilung verwenden. Folgende Parameter werden dann gewählt:
- N = 49; insgesamt befinden sich 49 Kugeln in der Trommel
- M = 6; insgesamt befinden sich sechs „Richtige“ Zahlen in der Trommel
- n = 6; insgesamt ziehen wir sechs Zahlen
- k = 6; von den sechs Zahlen die wir ziehen müssen auch alle sechs Zahlen richtig sein
Daraus lässt sich die Wahrscheinlichkeit wie folgt berechnen:
Drei Richtige lassen sich mit der gleichen Methode berechnen. Wir nehmen lediglich nun k = 3, da wir nur noch die Wahrscheinlichkeit für drei Richtige aus den sechs Gezogenen wissen wollen:
Mehr als zwei Möglichkeiten
Normalerweise betrachten wir Beispiele, bei denen es nur zwei Arten von Kugeln gibt. Mit der hypergeometrischen Verteilung können wir aber auch die Wahrscheinlichkeit für mehrere Arten von Kugeln oder andere Elemente benutzen.
N ist die Anzahl der Elemente in der Grundmenge: N = K1 + K2 + … + Kr
n ist die Anzahl der Elemente, die wir entnehmen wollen: n = k1 + k2 + … + kr
Beispiel
In einer Urne befinden sich 20 Kugeln. Davon sind 8 rot, 7 grün und die restlichen 5 gelb. Wir ziehen fünf Kugeln. Wie groß ist die Wahrscheinlichkeit, dass wir 2 rote, 2 grüne und eine gelbe Kugel ziehen werden?
Rechner für die hypergeometrische Verteilung
Mit dem Rechner können genaue Werte für die hypergeometrische Verteilung berechnet werden. Berechnet wird
- P(X = k) [„genau“],
- P(X ≤ k) [„höchstens“] und
- P(X ≥ k) [„mindestens“].
$$ \large P(X = k) \;=\; \frac{\displaystyle{M \choose k}{N-M \choose n-k}}{\displaystyle{N \choose n}} $$
Berechnungsergebnis
$$ \large P(X \leq k) \,=\, \sum_{i=0}^{\lfloor k\rfloor} \frac{{M \choose i}{N-M \choose n-i}}{{N \choose n}} $$
Berechnungsergebnis
$$ \large P(X \geq k) \,=\, \sum_{i=\lfloor k\rfloor}^{N} \frac{{M \choose i}{N-M \choose n-i}}{{N \choose n}} $$