Box-Whiskers-Plot
Das Box-Whisker-Plot (auch Boxplot oder zu deutsch Kastengrafik genannt) ist ein gebräuchlicher Diagrammtyp, der fünf Kennwerte (Minimum, Maximum, 1. Quartil, Median und 3. Quartil) umfasst. Der Name stammt aus dem Englischen und bezieht sich auf das Aussehen des Diagramms.
Box-Whisker-Plots zeigen Unterschiede zwischen Populationen, ohne dabei Annahmen über die unterliegende Verteilungsfunktion zu machen. Alle Kennwerte, die abbgebildet werden, gehören zur nichtparametrische Statistik. Das bedeutet, dass keine Annahmen über die zugrunde liegende Verteilungsfunktion gemacht werden.
Ablesbare Kennwerte
Zu den ablesbaren Kennwerten gehören die direkt ablesbaren Kennwerte:
- unteres Quartil (1. Quartil)
- Median (2. Quartil)
- oberes Quartil (3. Quartil)
- Minimum
- Maximum
Daneben lassen sich noch weitere Eigenschaften der Daten, aus dem Aussehen des Diagramms ablesen:
- Interquartilsabstand
- Spannweite
- Schiefe
Schiefe
Die Schiefe der Verteilungsfunktion lässt sich aus der Position des Medians innerhalb der Box bestimmen. Befindet sich der Median genau in der Mitte der Box, so ist die zugrunde liegende Verteilungsfunktion symmetrisch. Befindet sich der Median allerdings eher auf der linken Seite, dann sind die Daten linkssteil (bzw. reichtsschief). Liegt der Median dagegen eher rechts, so sind die Daten rechtsteil (bzw. linksschief). Diese Angaben gelten nur für unimodale Verteilungsfunktionen.
Whisker
Beim Box-Whisker-Plot werden nicht immer die Whisker mit eingezeichnet. In diesem Fall heißen die Diagramme lediglich Boxplot. Allerdings bedeutet im umgelehrten Fall die Bezeichnung Boxplot nicht zwangsläufig, dass das Diagramm keine Whisker hat.
Auch wenn die Whisker meistens das Minimum bzw. Maximum der Daten anzeigen, ist dies nicht einheitlich geregelt. Bei einigen Box-Whisker-Plots beziehen sich die Whisker auf den Interquartilsabstand. Da der Interquartilsabstand (IQR) auch verwendet wird, um Ausreißer zu bestimmen, werden Datenpunkte, die als Ausreißer klassifiziert wurden, bei einem solchen Box-Whisker-Plot meistens nach bzw. vor die Whisker aufgetragen. Meistens werden Ausreißer als Sternchen (*) eingezeichnet, und bei konkreten Studien sieht man häufiger auch noch die konkrete Nummer des Datensatzes daneben geschrieben. Die Whisker befinden sich dann in der Regel bei 3. Quartil + 1,5(IQR) für das Maximum und 1. Quartil − 1,5(IQR) für das Minimum.
Bei dieser Konvention würde man allerdings normalerweise annehmen, dass beide Whisker dieselbe Länge haben, weil sie jeweils das 1,5-fache vom Median entfernt liegen. Allerdings ist es so, dass per Konvention meistens der letzte Datenpunkt, der innerhalb des Interquartilsabstand liegt, als der Punkt genommen wird, wo das Whisker endet.