Standardfehler
Der Standardfehler (englisch: standard error, meist SE abgekürzt) ist die Standardabweichung der Stichprobenverteilung einer Stichprobenfunktion. In der Regel bezieht sich der Standardfehler dabei auf den Mittelwert und wird meistens dann als standard error of the mean (SEM abgekürzt) bezeichnet.
Statistik | Standardfehler |
---|---|
Mittelwert | \( \frac{s}{\sqrt{n}} \) |
Median | \( \sqrt{\frac{\pi }{2}}\cdot \frac{s}{\sqrt{n}} \) |
Standardabweichung | \( \frac{s}{\sqrt{2}\cdot n} \) |
Differenz zwischen unabhängigen Mittelwerten |
\( \sqrt{\frac{s_{1}^{2}}{n_1}+\frac{s_{2}^{2}}{n_2}} \) |
So ist beispielsweise der Mittelwert der Stichprobe der übliche Schätzer für den Mittelwert der Grundgesamtheit. Allerdings, wenn wir verschiedene zufällige Stichproben aus derselben Grundgesamtheit ziehen und jeweils den Mittelwert berechnen, würden diese Mittelwerte in der Regel unterschiedlich sein. Daher: Die Mittelwerte haben ihre eigene Verteilung (die wiederum ihren eigenen Mittelwert und ihre eigene Standardabweichung hat). Der Standardfehler des Mittelwerts (also der SEM und damit die Schätzung des Mittelwerts der Grundgesamtheit aus dem Mittelwert der Stichprobe) ist die Standardabweichung der Mittelwerte für alle möglichen Stichproben (mit jeder möglichen Stichprobengröße) die aus der Grundgesamtheit gezogen werden können.
Weil die Stichprobe eine zufällige Auswahl der unterliegenden Grundgesamtheit ist, werden gewisse Schätzungen von Stichprobe zu Stichprobe anders sein, sogar wenn das selbe Verfahren verwendet wird. Dies trifft vor allem auf kleine Stichproben zu.
Standardfehler des Mittelwerts (SEM)
Wenn wir über den Standardfehler sprechen, meinen wir meistens den Standardfehler des Mittelwerts, auch wenn wenn man den Standardfehler für andere Statistiken (wie beispielsweise den Median) berechnen kann. Der Standardfehler des Mittelwerts ist die Standardabweichung der Schätzung des Mittelwerts der Grundgesamtheit durch den Mittelwert der Stichprobe.
Alternativ kann man den Standardfehler des Mittelwerts auch als die Standardabweichung des Fehlers in dem Mittelwert der Stichprobe unter Betrachtung des wahren Mittelwerts angesehen werden, da der Mittelwert der Stichprobe ein erwartungstreuer Schätzer ist.
Der Standardfehler des Mittelwerts wird in der Regel berechnet, indem man die Standardabweichung der Stichprobe durch die Wurzel der Stichprobengröße teilt.
- s ist die Standardabweichung der Stichprobe (korrigierte Standardabweichung)
- n ist die Stichprobengröße
Der Standardfehler und die Standardabweichung neigen dazu, die wahre Standardabweichung und den wahren Standardfehler der Grundgesamtheit für kleine Stichproben zu unterschätzen. Bei einer Stichprobengröße von n = 2 liegt die Unterschätzung bei etwa 25 %, für n = 6 dagegen nur noch 5 %. Entsprechend finden sich Korrekturformeln, beispielsweise von Gurland und Tripathi (1971) sowie von Sokal und Rohlf (1981).
Was tun wenn s unbekannt ist? Approximation durch Student
Oft kennen wir den Wert der Standardabweichung bzw. Varianz nicht oder können ihn nicht berechnen. Daher benötigen wir in diesem Fall eine Verteilungsfunktion, die die Verteilung der möglichen Werte der Varianz berücksichtigt. Wenn man davon ausgehen kann, dass die Grundgesamtheit normalverteilt ist, kann man die t-Verteilung als Schätzung verwenden. Der Standardfehler ist die Standardabweichung der t-Verteilung.
Die t-Verteilung ist eine gute Approximation der Normalverteilung für eine Stichprobengröße von 120 oder größer.
Vorraussetzungen und Anwendung
Eine der häufigsten Anwendungen des Standardfehlers ist die Berechnung von Konfidenzintervallen. Konfidenzintervalle sind wichtig, um die Validität empirischer Tests und Forschung zu bestimmen. Sind die Daten etwa normalverteilt, kann der Standardfehler zusammen mit dem Mittelwert, Standardfehler und der Normalverteilung verwendet werden, um Konfidenzintervalle zu berechnen.
Das obere und untere Konfidenzintervall werden entsprechend der Formel unterhalb berechnet, wobei z1-α/2 dem Quantil der Standardnormalverteilung entstricht
- \( \bar{x} \) ist der Mittelwert
- SE ist der Standardfehler des Mittelwerts
- α ist das Signifikanzniveau (meist 5 % oder 1 %)
- z ist das Quantil (inverse kummulative Verteilungsfunktion) der Standardnormalverteilung
Da in der Regel auf einem Signifikanzniveau von α = 5 % getestet wird, findet man in der Literatur auch häufig die vereinfachte Formel ± SE · 1,96, da ein Wert von 1,96 einem Quantil von 0,975 der Standardnormalverteilung entspricht.
Der Standardfehler ermöglicht eine einfache Möglichkeit die mit einer Messung verbundenen Ungewissheit zu quantifizieren. Er wird aufgrund vieler verschiedener Gründe gerne verwendet:
- Wenn der Standardfehler für verschiedene einzelne Größe bekannt ist, kann der Standardfehler einer auf diesen Größen basierenden Funktion einfach berechnet werden
- Kennt man die zugrunde liegende Verteilungsfunktion, kann man mithilfe des Standardfehlers die Konfidenzintervalle berechnen
- Mit zunehmender Größe der Stichprobe, stellt der Zentrale Grenzwertsatz sicher, dass die Stichprobenverteilung des Mittelwerts etwa normalverteilt ist
Standardfehler vs Standardabweichung
In wissenschaftlichen Arbeiten werden Daten meist mit dem Mittelwert und der Standardabweichung oder dem Mittelwert und dem Standardfehler zusammengefasst. (In sehr wenigen Fällen findet man auch alle drei Angaben, nämlich Mittelwert, Standardabweichung und Standardfehler.) Dies führt zu Verwirrungen über deren Anwendbarkeit und Austauschbarkeit. Allerdings gehören sowohl Mittelwert als auch Standardabweichung zu den deskriptiven Statistiken, während der Standardfehler des Mittelwerts die Grenzen eines zufälligen Stichprobenverfahrens beschreiben.
Einfacher ausgedrückt: der Standardfehler macht eine Aussage darüber wie weit der Mittelwert der Stichprobe wahrscheinlich von dem Mittelwert der Grundgesamtheit entfernt ist, während uns die Standardabweichung sagt, wie weit sich einzelne Datenpunkte innerhalb einer Stichprobe vom Mittelwert der Stichprobe unterscheiden.
Wenn die Standardabweichung der Grundgesamtheit endlich ist, wird der Standardfehler sich mit ansteigender Stichprobengröße immer weiter Null nähern, da die Schätzung des Mittelwerts der Grundgesamtheit mit jedem weiteren zusätzlichen Datenpunkt verbessert und die Standardabweichung der Stichprobe sich damit immer näher an die Standardabweichung der Grundgesamtheit bewegt.
Relativer Standardfehler
Der relativer Standardfehler (englisch: relative standard error) ist ein Maß für die Normierung des Standardfehlers. Da die Höhe des Standardfehlers maßgeblich von dem Mittelwert abhängt, ist es schwierig, den Standardfehler ohne Kenntnis des Mittelwerts zu interpretieren. Drückt man den Standardfehler dagegen in Relation zum Mittelwert aus, erhält man ein Maß, welches Vergleiche zwischen verschiedenen Daten erlaubt.
Der relative Standardfehler ist damit keine neue Methode, aber oftmals ein besseres Maß, um statistische Information zu präsentieren. Da durch den Mittelwert geteilt wird, darf der relative Standardfehler nur für Variablen berechnet werden, die keinen Mittelwert von Null haben können. Auch Werte in der Nähe von Null, können den relativen Standardfehler stark überhöhen.
- SE ist der Standardfehler des Mittelwerts
- \( \bar{x} \) ist der Mittelwert
- n ist die Größe der Stichprobe
Für die Interpretation des relativen Standardfehlers existieren keine festen Grenzen, nach denen ein Wert als gut oder schlecht klassifiziert werden könnte. In einem Bericht der Vereinten Nationen (United Nations, 2005), heißt es beispielsweise, dass nur relative Standardfehler unter 25 % in Betracht gezogen werden sollten. Werte zwischen 25 % und 50 % sollten mit Vorsicht interpretiert werden; und Werte über 50 % sind demnach so unzuverlässig, dass sie nicht publikationsfähig sind. Allerdings gibt es vereinzelt und je nach Disziplin andere Empfehlungen und cut-off Werte.
Quellen
- Gurland, J., & Tripathi, R. C. (1971). A Simple Approximation for Unbiased Estimation of the Standard Deviation. The American Statistician, 25(4), 30. doi:10.2307/2682923
- Sokal, R. R., & Rohlf, F. J. (1981). Biometry: The principles and practice of statistics in biological research (2. ed.). New York: Freeman.
- United Nations. (2005). Guide to producing statistics on time use: Measuring paid and unpaid work. New York: United Nations.