\( \newcommand{\br}[1]{\left( #1\right)} \newcommand{\logpar}[1]{\log\left( #1\right)} \newcommand{\cospar}[1]{\cos\left( #1\right)} \newcommand{\sinpar}[1]{\sin\left( #1\right)} \newcommand{\tanpar}[1]{\tan\left( #1\right)} \newcommand{\arcsinpar}[1]{\sin^{-1}\!\left( #1\right)} \newcommand{\arccospar}[1]{\cos^{-1}\!\left( #1\right)} \newcommand{\arctanpar}[1]{\tan^{-1}\!\left( #1\right)} \newcommand{\asin}[1]{\sin^{-1}\! #1} \newcommand{\acos}[1]{\cos^{-1}\! #1} \newcommand{\atan}[1]{\tan^{-1}\! #1} \newcommand{\asinh}[1]{\sinh^{-1}\! #1} \newcommand{\acosh}[1]{\cosh^{-1}\! #1} \newcommand{\atanh}[1]{\tanh^{-1}\! #1} \newcommand{\logten}[1]{\log_{10}\! #1} \definecolor{explaination}{RGB}{0, 166, 226} \newcommand{\ubrace}[2][u]{ { \color{explaination}{\underbrace{ {\color{black}{#2}} }_{#1}} } } \newcommand{\obrace}[2][u]{ { \color{explaination}{\overbrace{ {\color{black}{#2}} }^{#1}} } } \definecolor{highlight}{RGB}{181, 41, 118} \newcommand{\xplain}[1]{{ \textcolor{explaination} { \footnotesize{ #1 \newline}}}} \newcommand{\hilite}[1]{{ \textcolor{highlight} { { #1 }}}} \definecolor{lightergray}{gray}{.675} \newcommand{\hide}[1]{{ \textcolor{lightergray} { \footnotesize{ #1 \newline}}}} \newcommand{\mth}[1]{ { \textcolor{black} { { \small #1 } } } } \)

Skalen, Skalenniveaus

Vor allem in empirischen Wissenschaften ist es von großer Wichtigkeit zu wissen, wie eine gemessene Variable skaliert ist. Das zugrundeliegende Skalenniveau einer Variable gibt Auskunft darüber, wie mit ihr gerechnet werden darf, wie man sie transformieren kann und welche Interpretationen zulässig sind. Die Theorie hinter der Verwendung von verschiedenen Skalenniveaus wurde 1946 von dem amerikanischen Psychologen Stanley Smith Stevens entwickelt.

   Nominalskala Ordinalskala Intervallskala Verhältnisskala
Mathematische &
logische
Operationen
×
÷

(, mit Ausnahmen)
+
 − 
<
>
=
(natürlicher) Nullpunkt
Berechenbare Lageparameter  Modus Modus,
Median
Modus,
Median,
arithme­tisches Mittel
Modus,
Median, arithme­tisches Mittel,
geome­trisches Mittel
Steig oder diskret? diskret diskret sowohl stetig als auch diskret möglich stetig
Qualitativ oder Quantitativ? Qualitativ Qualitativ Quantitativ Quantitativ
Beispiel
  • Geschlecht
  • Haarfarbe
  • Bundesland
  • Lieblings­farbe
  • Schulnoten
  • Likert-Skala
  • Sozialer Status
  • militärische Ränge
  • Intelligenz­quotient[2,3,4,5]
  • Temperatur in Celcius oder Fahrenheit
  • Datumsangaben
  • Temperatur in Kelvin
  • Energie
  • Einkommen / Geld
  • Einwohnerzahl
  • Geschwin­digkeit

Qualitative und quantitative Daten

Qualitative Daten werden nicht in Zahlen, sondern vielmehr durch natürliche Sprache beschrieben. Häufig wird der Begriff kategorische Daten synonym verwendet. Auch wenn wir die Daten kategorisiert haben, können sie immer noch eine Struktur haben. Wenn keine natürliche Ordnung vorliegt, sind die Daten nominalskaliert. Besitzen die Ausprägungen der Variablen hingegen eine natürliche Reihenfolge, so sind sie ordinalskaliert.

Allerdings können auch numerische Variablen nominal- oder ordinalskaliert sein. Ein Beispiel hierfür wären Versicherungsnummern oder Kleidergrößen.

Nominalskala

Geschlecht ist nomialskaliertDie Nominalskala (von lateinisch nomen = Namen, Bezeichnung, Kennung) ist die einfachste der Skalen. Sie unterscheidet die einzelnen Items nur anhand ihres Names oder ihrer Kategorie – es wird keine Aussage über die Wertigkeit gemacht. Beispiele für nomialskalierte Variablen sind Geschlecht, Nationalität, ethnische Herkunft, Sprache, Genre, Stil und Form. Normalerweise werden Nominalskalen so dargestellt, dass ihr prozentualer Anteil am Ganzen ersichtlich ist. Daher ist der Modus der einzige Lageparameter, der berechnet werden kann.

Nomialskalierte Variablen werden, für bessere Überschaubarkeit, gerne in einer Häufigkeitstabelle zusammengefasst. Aus Häufigkeitstabellen lassen sich widerum auch die Orginaldaten rekonstruieren.

Ordinalskala

Bei der Ordinalskala (von lateinisch ordo, ordinis = Reihe, Ordnung), haben die einzelnen Variablen einen Rang (erstes, zweites, drittes, …). Wir wissen allerdings nur, dass ein Wert besser oder höher ist als ein anderer, nicht aber wie viel. Daher können bei der Ordinalskala die Ausprägung der zugrunde liegenden Merkmale natürlich geordnet werden. Bei Marathonläufen können wir sagen, dass es einen ersten, zweiten und dritten Platz gibt. Allerdings, ob die erstplatzierte Person eine Stunde oder nur eine Minute schneller war als die zweitplatzierte wissen wir nicht (und ist in diesem Fall auch unerheblich).

Dass es bei der Ordinalskala hauptsächlich um die Reihenfolge der einzelnen Items geht kann man sich einfach merken: ordial- klingt wie order, welches das englische Wort für Reihenfolge ist.

Stevens bemerkte 1946, dass die meisten psychologischen Messungen, zu denen auch Meinungsumfragen zählen, in der Regel ordinalskaliert sind[2]. Daher liefern arithmetisches Mittel und Standardabweichung keine aussagekräftigen Daten. Auch wenn es Autoren gibt[1] die annehmen, Intelligenz sei intervallskaliert, so geht die Tendenz dahin, Intelligenz als ordinalskaliertes Merkmal zu betrachten.

Intervallskala

Datumsangaben sind intervallskaliertBei der Intervallskala (von lateinisch intervallum = Abstand, Zwischenraum, Entfernung) kennen wir nicht nur den Rang der Elemente, sondern auch den Unterschied zwischen den einzelnen Elementen. Daher ist es so, dass beispielsweise die Differenz zwischen dem 1. und 2. Elemente dieselbe ist, wie zwischen dem 4. und 5. oder dem 99. und 100. Anders ausgedrückt: das Intervall ist dasselbe. Das am häufigste verwendete Beispiel für eine intervallskalierte Variable ist die Temperatur (in Grad Celsius gemessen). Die Tatsache, dass die Temperatur in Celsius gemessen wird ist entscheidend, da nicht jede Temperaturskala intervallskaliert ist.

Lineare Transformationen

Prinzipiell sind alle linearen Transformationen für die Intervallskala zulässig. Da bei der Intervallskala die Differenzen interessieren, ist es wichtig, dass die Aussage, die durch sie getroffen wird, gleich bleibt. Hierzu ein Beispiel einer intervallskalierten Variablen X:

Variable X Z Y K W
Transformationsvorschrift X+1 X · 10 X/X²+10 X³
X1 0 1 0 0 0
X2 1 2 10 1/11 1
X3 2 3 20 1/7 8
X4 4 5 40 2/13 64
X5 5 6 50 1/7 125
Transformation zulässig?

In der Tabelle oben sind einige Transformationen der intervallskalierten Variable X zu sehen. Bei intervallskalierten Variablen wollen wir Aussagen wie „Die Differenz zwischen X1 und X2 ist dieselbe, wie die Differenz zwischen X4 und X5“ treffen. Diese Aussage muss auch mit der transformierten Variable möglich sein. In unserer Beispieltabelle ist dies für die transformierten Variablen Z und Y möglich, nicht aber für K und W.

Generell gilt: Wird die intervallskalierte Variable mit einem konstanten Wert multipliziert oder durch einen konstanten Wert geteilt, so ist die Transformation immer noch zulässig, da dieselben Aussagen über das Verhältnis der einzelnen Variablen zueinander getroffen werden können. Jede Transformation, die der Funktionsvorschrift X‘ = a + X · b genügt (a und b sind reelle Zahlen) ist eine lineare Transformation.

Verhältnisskala (auch Ratioskala)

Dauer ist verhältnisskaliertDie Verhältnisskala, auch Ratioskala (von lateinisch ratio = Verhältnis, Rechnung, Berechnung) genannt, vereint alle Eigenschaften des oben genannten Skalenniveaus. Damit eine Variable allerdings verhältnisskaliert ist, muss die ihr zugrundeliegende Eigenschaft einen natürlichen Nullpunkt besitzen. Beispiele für verhältnisskalierte Variablen sind Größe, Gewicht oder Energie. All diese Eigenschaften besitzen eine unterste Grenze – einen natürlichen Nullpunkt. Es gibt nichts, welches kleiner als 0cm ist oder weniger als 0g wiegt. Auch Geld ist verhältnisskaliert, auch wenn die Bank dem Kunden erlaubt, das Konto zu überziehen, und man somit meinen könnte, dass kein natürlicher Nullpunkt mehr gegeben ist. 

In der Tabelle oben werden Datumsangaben als intervallskaliert definiert. Dies ist daher, weil unsere Zeitrechnung keinen natürlichen Nullpunkt, sondern einen willkürlich gewählten Nullpunkt (die Geburt Christi) besitzt. Datumsangaben könnten auch verhältnisskaliert sein, wenn man den Urknall als natürlichen Nullpunkt annimmt.

Natürlicher Nullpunkt

Bei dem natürlichen Nullpunkt geht es in erster Linie darum, dass ein Nullpunkt nicht willkürlich festgelegt wurde. Dieser Wert darf nicht unterschritten werden, da eine Unterschreitung nicht vereinbar wäre mit physikalischen Gesetzen oder logischen Annahmen. In der Regel wird dieser Wert allerdings auf 0 festgelegt, wobei ein anderer Wert auch möglich wäre.

Quellen

  1. Gardner, P. L. (1975). Scales and Statistics. Review of Educational Research, 45(1), p 43-57. Retrieved from http://www.jstor.org/stable/1170022
  2. Bartholomew, D. J. (2004). Measuring intelligence: Facts and fallacies. Cambridge, UK, New York: Cambridge University Press.
  3. Mackintosh, N. J. (1998). IQ and human intelligence. Oxford, New York: Oxford University Press.
  4. Truch, S. (1993). The WISC-III companion: A guide to interpretation and educational intervention. Austin, Tex: PRO-ED.
  5. Stevens, S. S. (1946). On the Theory of Scales of Measurement. Science, 103(2684), 677–680. doi:10.1126/science.103.2684.677