MatheGuru Logo

t-Verteilung | Student's t-Verteilung


t-VerteilungWenn die Standardabweichung σ der Grundgesamtheit unbekannt ist, benutzt man die t-Verteilung (anstatt der Normalverteilung), vorrausgesetzt die nötigen Bedingungen sind erfüllt. Da σ unter reelen Bedingungen meistens nicht bekannt ist, sind die Informationen in diesem Artikel realitätsnah, da sie häufig genau so angewendet werden.

Die t-Verteilung ist die unterliegede Verteilungsfunktion des t-Tests.

 

Definition

Formell gesehen ist die t-Verteilung wie folgt definiert:

Der einzige Parameter, den die t-Verteilung benötigt, ist v, die Freiheitsgrade.

Γ ist die Gammafunktion, welche eine Erweiterung der Fakultätsfunktion ist. Die Gammafunktion benötigt einen einzigen Parameter n und ist für natürlichen Zahlen wie folgt definiert: . Die Gammafunktion ist allerdings für alle positiven reellen Zahlen (außer 0) definiert: .

Reel bertrachtet, müssen diese Definitionen allerdings nicht auswendig gelernt werden, da meistens Tabellenkalkulationsprogramme und andere statistische Software die Berechnungen im Hintergrund durchführen. Im weiteren Verlauf dieses Artikels werden wir uns nur noch mit den Eigenschaften der t-Verteilung beschäftigen, mit dessen Gleichung.

Kriterien für die Benutzung der t-Verteilung

Allgemein existieren drei Kriterien, die erfüllt sein müssen, damit die t-Verteilung zur Berechnung verwendet werden kann:

  • Die Standardabweichung und damit auch die Varianz der Grundgesamtheit sind nicht bekannt
  • Die Stichprobe muss zufällig entnommen sein
  • Die Grundgesamtheit der Daten, aus der die Stichprobe entnommen wurde, muss normalverteil oder annähernd normalverteilt sein oder die Stichprobe muss mindestens 30 Messwerte umfassen

Allerdings ist eine Stichprobengröße von mehr als 30 kein absolutes Kriterium. Ist die unterliegende Verteilungsfunktion der Grundgesamtheit quasi normalverteilt, also nur wenig von einer Normalverteilung entfernt, können auch Stichproben kleiner als 30 mit der t-Verteilung gerechnet werden.

Eigenschaften der t-Verteilung


EigenschaftWert
Parameter
Wertebereich
Verteilungsfunktion
Dichtefunktion
Mittelwert 0, wenn v > 0, sonst nicht definiert
Median
Modus
Varianz wenn v > 4,
∞ wenn 2 < v ≤ 4,
ansonsten nicht definiert
Schiefe 0, wenn v > 3, sonst nicht definiert

Um die t-Verteilung verwenden zu können, muss die Stichprobe zufällig sein und die Verteilungsfunktion der Grundgesamtheit normalverteilt bzw. annähernd normalverteilt sein, oder die Stichprobe muss mehr als 30 Datensätze umfassen.

Die folgenden Eigenschaften hat die t-Verteilung gemein mit der Standardnormalverteilung:

  • Glockenförmiges Aussehen
  • Symmetrisch (um 0)
  • Der Median, Modus und Mittelwert sind 0 und befinden sich nahe des Zentrums der Verteilungsfunktion
  • Die Verteilungsfunktion konvergiert gegen 0, allerdings wird kein Wert von f(x) jemals 0
  • Die Fläche unter der Kurve ist immer 1

Folgende Eigenschaften unterscheiden die t-Verteilung von der Standardnormalverteilung:

  • Je größer der Parameter v wird, desto mehr nähert sich die t-Verteilung der Standardnormalverteilung, daher der Normalverteilung mit einem Erwartungswert von 0 und einer Standardabweichung von 1
  • Die Varianz ist größer als 1
  • Die t-Verteilung gehört zu einer Gruppe von Verteilungsfunktionen, welche Freiheitsgrade als Parameter verwenden. Die Freiheitsgrade beziehen sich dabei auf die Größe der Stichprobe.
  • Sie ist endlastiger (heavy-tailed) als die Normalverteilung. Das heißt, dass sie eher Werte hervorbringen wird, die weiter vom Mittelwert entfernt liegen.

Freiheitsgrade (Degrees of Freedom)

Viele statistische Verfahren verwenden ein Konzept namens Freiheitsgrade (englisch: degrees of freedom, DF). Jede Verteilungsfunktion hat eine andere Methode, um die Anzahl der Freiheitsgrade zu berechnen. Man kann sich die Freiheitsgrade als Anzahl an Möglichkeiten vorstellen, um von A nach B zu kommen.

Nehmen wir beispielsweise an, dass das arithmetische Mittel von drei Zahlen 10 ist. Wir wissen die Zahlen sind 5, 11 und eine weitere unbekannte Zahl. Um die unbekannte Zahl zu bestimmen, können wir einfach die folgende Gleichung lösen: . Auch wenn wir gesagt haben, dass die Zahl unbekannt sei, können wir sie mit bereits mit wenig Algebra berechnen (x = 14).

In einem zweiten Datensatz haben wir nun wieder drei Zahlen. Wir wissen, dass der Mittelwert 20 ist und dass eine der Zahlen 25 ist. Die anderen beiden Zahlen — wir nennen sie x und y — kennen wir nicht. Aus der Gleichung  können wir berechnen, dass x = 35 − y sein muss. Wir können allerdings keinen konkreten Wert für x berechnen, sondern nur einen Wert in Abhängigkeit einer anderen Variablen. Wir haben daher einen Freiheitsgrad.

In einer weiteren Stichprobe mit 1000 Messwerten wissen wir nun, dass der Mittelwert 15 ist. Wenn wir das wissen, allerdings nicht die konkreten Messwerte kennen, haben wir n − 1, also 999 Freiheitsgrade. Die Summe aller Messwerte muss 1000 · 15 = 15000 betragen. Wenn wir 999 Messwerte haben, ist der letzte fehlende Messwert bereits bestimmt, da es nur eine einzige Zahl gibt, die noch zu den anderen addiert 15000 ergibt.

Anwendungsbereiche


Die t-Verteilung wird dort eingesetzt, wo ein unbekannter Parameter (wie beispielsweise der Mittelwert) geschätzt werden soll, in einer Situation, in der die Boabachtungen durch additive Fehler konfundiert sind. (Additive Fehler sind Werte die zu dem eigentlichen Wert hinzuaddiert worden sind. Die Summe aus tatsächlichem Wert und Fehlerwert ergibt den Messwert. Das Modell der additiven Fehler ist das beliebteste in der Statistik.) In fast allen statistischen Untersuchungen ist die Standardabweichung der Grundgesamtheit dieser Fehler unbekannt und muss aus den Daten geschätzt werden. Die t-Verteilung wird dabei häufig verwendet, um diese Fehler zu kompensieren. Wäre allerding die Standardabweichung der Fehler bekannt, so würde in der Regel die Normalverteilung statt der t-Verteilung verwendet werden.

Geschichte der t-Verteilung


William S. GossetDie t-Verteilung wurde von William S. Gosset entdeckt. Er machte 1899 an der prestigereichen Oxford Universität Abschlüsse in den Fächern Mathematik und Chemie. Im gleichen Jahr wollte die Guinness Brauerei in Dublin, Irland zum ersten Mal in ihrer Geschichte das Bierbrauen wissenschaftlich untersuchen. Sie schrieben Stellen aus, und Gosset bekam eine Arbeitsstelle. In den kommenden Jahren beschäftigte sich Gosset mit Hopfen, Malz und Gerste.

Guinness wollte Bier konstant in einer hohen Qualität herstellen. Wissenschaftler wie Gosset sollten herausfinden, wie man die Qualität des Bieres dauerhaft erhöhen kann. Von besonderem Interesse war dabei die Ursache schlechter Chargen. Gosset untersuchte hauptsächlich den Einfluss der Gerste in diesem Prozess. Während ein Vollblutwissenschaftler Experimente durchführen würde, wollte ein wirtschaftlich orientiertes Unternehmen wie eine Brauerei kein Geld für großangelegte Forschung ausgeben, vor allem nicht solche, wo im vorhinein schon feststehen würde, dass man das Bier wegschütten müsste. Gosset musste also aus nur wenigen Informationen und wenigen Experimenten statistisch herleiten, weshalb beispielsweise eine Sorte Gerste schlechtes Bier produziert.

Gosset war der Aufgabe allerdings gewachsen, auch wenn er von seinen Kollegen nur wenig Achtung bekam. Die anderen Mitarbeiter der Brauerei hielten ihn mehr für einen Professor der Mathematik als für einen echten Bierbrauer, während seine Kollegen im biometrischen Labor des University College London ihn mehr für einen Bierbrauer als für einen Wissenschaftler hielten.

Aus der Notwendigkeit nur mit kleinen Stichproben und einer unbekannten Grundgesamtheit zu arbeiten entwickelte Gosset die t-Verteilung und den t-Test — ein elegant einfaches Verfahren, im Vergleich zu anderen statistischen Methoden der damaligen Zeit. Allerdings erlaubte die Guinness Brauerei ihren Mitarbeitern nicht, Forschungsergebnisse zu publizieren, da ein Mitarbeiter bereits Firmengeheimnisse veröffentlicht hatte.

Noch heute wird die t-Verteilung meistens "Student’s t" genannt (vor allem im englischsprachigen Raum), da Gosset seine Entdeckung unter dem Pseudonym Student dennoch veröffentlichte. Nur wenige seiner Kollegen wussten tatsächlich, wer "Student" war. Erst mit seinem Tod erfuhr die Brauerei das Geheimnis um Gossets anonyme Publikation, und das auch nur, weil seine Kollegen ihn und seine Arbeit würdigen wollten.

t-Verteilung interaktiv


Neben der gängigen t-Verteilung, existiert noch eine weitere Verteilungsfunktion, die auf der Definition der t-Verteilung basiert. Sie hat einen weiteren Parameter, den Nonzentralitätsparamter. Er verschiebt die t-Verteilung nach rechts, verändert aber auch deren Form. Die t-Verteilung ist identisch mit der nichtzentralen t-Verteilung, wenn der Nonzentralitätsparameter Null ist. Die nichtzentrale t-Verteilung wird vor allem zur Berechnung des β-Fehlers (Fehler 2. Art) bei t-verteilten Hypothesentests verwendet.

Rechnung für die t-Verteilung



Mathematik für Schule und Studium