\( \newcommand{\br}[1]{\left( #1\right)} \newcommand{\logpar}[1]{\log\left( #1\right)} \newcommand{\cospar}[1]{\cos\left( #1\right)} \newcommand{\sinpar}[1]{\sin\left( #1\right)} \newcommand{\tanpar}[1]{\tan\left( #1\right)} \newcommand{\arcsinpar}[1]{\sin^{-1}\!\left( #1\right)} \newcommand{\arccospar}[1]{\cos^{-1}\!\left( #1\right)} \newcommand{\arctanpar}[1]{\tan^{-1}\!\left( #1\right)} \newcommand{\asin}[1]{\sin^{-1}\! #1} \newcommand{\acos}[1]{\cos^{-1}\! #1} \newcommand{\atan}[1]{\tan^{-1}\! #1} \newcommand{\asinh}[1]{\sinh^{-1}\! #1} \newcommand{\acosh}[1]{\cosh^{-1}\! #1} \newcommand{\atanh}[1]{\tanh^{-1}\! #1} \newcommand{\logten}[1]{\log_{10}\! #1} \definecolor{explaination}{RGB}{0, 166, 226} \newcommand{\ubrace}[2][u]{ { \color{explaination}{\underbrace{ {\color{black}{#2}} }_{#1}} } } \newcommand{\obrace}[2][u]{ { \color{explaination}{\overbrace{ {\color{black}{#2}} }^{#1}} } } \definecolor{highlight}{RGB}{181, 41, 118} \newcommand{\xplain}[1]{{ \textcolor{explaination} { \footnotesize{ #1 \newline}}}} \newcommand{\hilite}[1]{{ \textcolor{highlight} { { #1 }}}} \definecolor{lightergray}{gray}{.675} \newcommand{\hide}[1]{{ \textcolor{lightergray} { \footnotesize{ #1 \newline}}}} \newcommand{\mth}[1]{ { \textcolor{black} { { \small #1 } } } } \)

Interquartilsabstand

Im Verhältnis zu anderen Streuungsmaßen, wie beispielsweise Standardabweichung, Varianz oder der Standardmessfehler, ist der Interquartilsabstand (engl. interquartile range, IQR) am wenigsten anfällig für Ausreißer. Daher ist der Interquartilsabstand neben der mittleren absoluten Abweichung einer der besten robusten Schätzer.

Definition

Der Interquartilsabstand ist die Differenz zwischen dem 3. Quartil Q3 und dem 1. Quartil Q1:

\( \Large{ \mathrm{Interquartilsabstand} \;=\; Q_3 – Q_1 \;=\; Q_{0{,}75}-Q_{0{,}25} } \)

Im Gegensatz zur Spannweite, die das Minimum und Maximum des gesamten Datensatzes abbildet, repräsentiert der Interquartilsabstand die Spannweite des ersten und dritten Quartils und ist damit im Gegensatz nur wenig durch Ausreißer (besonders große oder besonders kleine Werte) beeinflusst. Da der Interquartilsabstand das erste und dritte Quartil als Referenz verwendet, liegen immer insgesamt 50% der Daten innerhalb des Interquartilabstands.

Interpretation des Interquartilsabstandes

Da der Interquartilsabstand ein Streuungsmaß ist, erlaubt er Rückschlüsse über die Verteilung (Dispersion) der Daten. Ein geringer Interquartilsabstand bedeutet, dass die Daten nahe beieinander liegen bzw. näher am Median liegen. Ein größerer Interquartilsabstand hingegen bedeutet, dass die Daten weit auseinander liegen, also nicht konsistent sind.

Datensätze sind weit auseinander verstreut
Die Daten sind weit verstreut;
der Interquartilsabstand ist höher
Datensätze sind eng beieinander
Die Daten liegen nahe beieinander;
der Interquartilsabstand ist niedriger

Liegt der Median genau in der Mitte des Interquartilsabstandes, so ist die Verteilungsfunktion höchstwahrscheinlich symmetrisch. Bei einer symmetrischen Verteilungsfunktion ist auch die mittlere absolute Abweichung genau das doppelte des Interquartilsabstandes.

Im Gegensatz zur Standardabweichung, bedeutet ein Interquartilsabstand von null nicht, dass die Daten keine Streuung besitzen.

Grafische Darstellung

Boxplot, Box-Whisker-PlotHäufig werden Box-Whisker-Plots verwendet, um Daten zu veranschaulichen. Der Vorteil eines Box-Whisker-Plots ist es, dass es viele verschiedene statistische Kennwerte darstellen kann, aber gleichzeitig überschaubar bleibt. Auch der Interquartilabstand lässt sich aus einem Box-Whisker-Plot ablesen: er ist die Länge der Box (siehe Abbildung rechts).

Ausreißer

Der Interquartilsabstand kann auch verwendet werden, um Ausreißer in einem Datensatz zu finden. In diesem Fall wäre ein Ausreißer ein Wert der unter Q1 − 1,5(IQR) oder über Q3+1,5(IQR) fällt. In manchen Varianten des Box-Whisker-Plots werden die Whisker nach dieser Definition eingezeichnet und Ausreißer noch einmal separat im Diagramm aufgetragen.