Freiheitsgrade
In der Statistik sind die Freiheitsgrade ein Maß für die Genauigkeit, die erforderlich ist, um einen Parameter zu schätzen (d.h. eine Größe, die einen bestimmten Aspekt der Bevölkerung repräsentiert). Freiheitsgrade drücken die Anzahl der unabhängigen Faktoren aus, auf denen die Parameterschätzung basiert und sind oft eine Funktion der Stichprobengröße. Generell steigt die Anzahl der Freiheitsgrade mit zunehmender Stichprobengröße und sinkt mit der Anzahl der geschätzten Parameter. Freiheitsgrade werden üblicherweise mit df abgekürzt oder mit dem griechischen Kleinbuchstaben nu, ν.
Für eine Reihe von Beobachtungen sind die Freiheitsgrade die Mindestanzahl unabhängiger Werte, die zur Auflösung des gesamten Datensatzes erforderlich sind. Sie entsprechen der Anzahl unabhängiger Beobachtungen, die zur Bestimmung der Schätzung (n) herangezogen werden, abzüglich der Anzahl der Parameter, die bei der Annäherung des Parameters selbst geschätzt werden, wie sie durch das betrachtete statistische Verfahren bestimmt wird.
Test | df |
---|---|
Einstichproben t-Test | N − 1 |
gepaarter t-Test | N − 1 |
abhängiger t-Test | N − 2 |
Chi²-Test | (#Zeilen − 1)× |
Korrelationen | N − 2 |
Anders ausgedrückt, es wird eine mathematische Einschränkung verwendet, um die Schätzung eines Parameters aus anderen geschätzten Parametern zu kompensieren. Für eine einzelne Stichprobe wird z.B. ein Parameter geschätzt. Dies ist in vielen statistischen Verfahren der Populationsmittelwert, der aus der Mittelwert der Stichprobe geschätzt wird, was zu n-1 Freiheitsgraden für die Schätzung der Populationsvariabilität führt. Für zwei Stichproben haben wir hingegen n1+n2-2 Freiheitsgrade.
Zum Beispiel schätzt der 1-Stichproben t-Test nur einen Parameter: Den Populationsmittelwert. Ein Stichprobenumfang von n stellt n Informationen zur Schätzung des Bevölkerungsdurchschnitts und seiner Variabilität dar. Ein Freiheitsgrad wird wird für die Schätzung des Mittelwert verwendet, und die restlichen n-1 Grad der Freiheit Schätzung Variabilität. Daher verwendet ein 1-Stichproben t-Test eine t-Verteilung mit n-1 Freiheitsgraden.
Konzept der Freiheitsgrade
Das Konzept der Freiheitsgrade ist grundlegend für das Verständnis der Schätzung von Populationsparametern (z.B. Mittelwert) auf der Grundlage von Informationen, die aus einer Stichprobe gewonnen wurden. Die Menge der Informationen, die für eine Schätzung der Grundgesamtheit verwendet werden, kann je nach Stichprobenumfang erheblich variieren. Beispielsweise basiert die Standardabweichung (ein Maß für die Variabilität) einer Population, die auf eine Stichprobengröße von 100 geschätzt wird, auf zehnmal mehr Informationen als eine Stichprobengröße von 10. Die Verwendung großer Mengen unabhängiger Informationen (d.h. eines großen Stichprobenumfangs) zur Schätzung der Population bedeutet in der Regel, dass die Wahrscheinlichkeit, dass die Stichprobenschätzungen wirklich repräsentativ für die gesamte Population sind, größer ist. Das ist die Bedeutung hinter der Anzahl der Freiheitsgrade. Je größer die Freiheitsgrade sind, desto größer ist das Vertrauen des Forschers, dass die aus der Stichprobe gewonnenen Statistiken die Population genau beschreiben.