MatheGuru Logo

Sphärizität

Sphärizität (auch Zirkularität) ist eine zusätzliche Annahme, die bei statistischen Verfahren mit Messwiederholung gemacht werden muss. Ist Sphärizität gegeben, so sind die Varianzen der Differenzen aller Messpaare (daher aller Stufen der unabhängigen Variablen) der Messungen gleich, ähnlich Homoskedastizität. Sphärizität kann gemessen werden, wenn drei oder mehr Stufen der unabhängigen Variablen existieren.

Der bekannteste Test, um Daten auf Sphärizität zu überprüfen, ist der Mauchly Test. Wenn der p-Wert des Mauchly-Test größer oder gleich des festgelegten alpha-Niveaus ist (in der Regel .05), können wir davon ausgehen, dass die Sphärizität der Daten gegeben ist. Wird der Mauchly-Test hingegen signifikant (wenn p < .05), dann müssen wir die Freiheitsgrade nach unten korrigieren, da wir sonst ein erhöhtes Risiko eingehen, einen Fehler 1. Art zu begehen.

Bei vorhandener Sphärizität kann, wie gehabt, der p-Wert der rmANOVA interpretiert werden. Sollte die Annahme der Sphärizität allerdings verletzt worden sein, so müssen die Freiheitsgrade nach unten korrigiert werden. Bekannte Korrekturen sind die von Greenhouse-Geisser und Huynh-Feldt. In der Literatur finden sich Empfehlungen, wann welche Korrektur angemessen ist, die wir auch hier diskutieren werden.

Welche Korrektur wann verwenden?

In der Tabelle sehen wir die Daten von fünf Versuchspersonen, die ein Medikament über drei Wochen bekamen. Einmal die Woche wurde ein Test gemacht, deren Werte hier eingetragen sind (rechts). Auf der linken Seite sehen wir die Differenzen der Werte zwischen allen möglichen Paaren von Messzeitpunkten, jeweils pro Versuchsperson. Die Differenzen von t1 − t3 unterscheiden sich von den anderen. Eventuell wurde hier die Annahme der Sphärizität verletzt.
VP t1 t2 t3 t1 − t2 t1 − t3 t2 − t3
1 20 25 17 -5 3 8
2 33 39 30 -6 3 9
3 21 24 18 -3 3 6
4 18 19 14 -1 4 5
5 7 9 5 -2 2 4
Varianz (hier: Standardabweichung): 4,3 0,5 4,3

Die Ausmaß der Verletzung der Sphärizität wird durch epsilon (ε) beschrieben. Hiernach richtet sich auch das anzuwendende Korrekturverfahren. Allerdings — wie so oft in der Statistik — sind dies auch keine einheitlichen Empfehlungen. Verschiedene Autoren werden verschiedene Quellen zitieren und auch die Statistik unterliegt sich ändernden Trends.

Generell gilt allerdings: wenn die Varianzen zwischen allen Gruppen gleich ist und die Sphärizität ohne Abweichungen eingehalten wird, wird epsilon exakt 1 sein. Dann liegt Sphärizität vor. Wenn die Varianz der Differenzen zwischen allen möglichen Paaren ungleich ist und Sphärizität nicht gegeben ist, wird epsilon unter 1 sein. Je weiter epsilon von 1 entfernt ist, desto stärker die Verletzung der Sphärizitätsannahme.

Von den beiden genannten Korrekturen ist die Greenhouse-Geisser-Korrektur die konservativere und die Huynh-Feldt-Korrektur liberaler. Oft wird deshalb pauschal die Korrektur nach Greenhouse-Geisser empfohlen, auch wenn die Verletzung der Sphärizität eventuell nur klein gewesen sein mag.

Girden (1992) empfiehlt die Grenze zwischen der Wahl der beiden Korrekturverfahren bei einem epsilon von .75 festzulegen. Bei ε > .75 sollte demnach die Huynh-Feldt-Korrektur verwendet werden, während bei ε < .75 die Greenhouse-Geisser-Korrektur angewendet werden sollte. Bei unbekannter Sphärizität wird ebenfalls empfohlen die Greenhouse-Geisser-Korrektur anzuwenden, da in der Praxis die Annahme über Sphärizität nie exakt eingehalten wird.

In einigen Statistikprogrammen findet sich oft auch noch eine dritte Korrektur: der Lower-Bound. Sie geht von der schlimmstmöglichen Verletzung der Sphärizität aus und korrigiert die Freiheitsgrade am stärksten nach unten. Sie ist allerdings auch gleichzeitig das Verfahren, was am einfachsten zu berechnen ist. Deshalb wurde es vor allem früher verwendet, als Berechnungen noch teilweise ohne Computer gemacht wurden. Heute wird eher empfohlen, eines der anderen beiden Verfahren zu verwenden.

Merke:

Die Mauchly-Test ist stark abhängig von der Stichprobengröße und der Normalverteilung der Daten. Als Konsequenz, ist der Mauchly-Test nur mit Einschränkungen in der Lage, korrekt Sphärizität in kleinen und großen Stichproben zu bestimmen. Bei kleineren Stichproben findet der Mauchly-Test oft kleine Verletzung der Sphärizität auch wenn sie besteht, während er in größeren Stichproben Verletzungen der Sphärizität feststellt, die nicht vorhanden sind (Salkind, 2007; O'Brien und Kaiser, 1985).

Auch ist der Mauchly-Test anfällig für Verletzungen der (multivariaten) Normalverteilungsannahme. Hier erhöht sich die Wahrscheinlichkeit, einen Fehler erster Art zu begehen, teilweise um das Mehrfache. Daher sollten die Daten auf ihre Verteilungseigenschaften überprüft und gegebenenfalls entsprechend transformiert werden.

MANOVA als Alternative

Alternativ kann auch eine multivariate Statistik (z.B. eine MANOVA) gerechnet werden, da Sphärizität keine Voraussetzung für sie ist. Allerdings muss man auch Kompromisse eingehen: zwar ist Sphärizität keine Grundannahme mehr, allerdings solche Verfahren weniger Power haben — sie sind daher weniger in der Lage einen Effekt zu finden, da auch tatsächlich vorhanden ist. Dies ist vor allem der Fall, wenn die Verletzung der Sphärizität nicht groß ist oder die Stichprobengröße klein ist (Harvard). O’Brien and Kaiser (1985) schlugen vor, dass wenn ε < .7 und die Stichprobengröße größer als k + 10 (k sind die Anzahl der Stufen der unabhängigen Variablen), eine MANOVA mehr statistische Power hätte und verwendet werden sollte. In anderen Fällen sollte eine rmANOVA gerechnet werden. Zusätzlich muss noch gesagt werden, dass die Power der MANOVA auch von den Korrelationen der abhängigen Variablen untereinander abhängt, es müssen daher auch die Beziehungen der einzelnen Variablen zueinander berücksichtigt werden, falls eine MANOVA als Alternative in Betracht gezogen wird.

Quellen

  1. Girden, E. R. (1992). ANOVA: Repeated measures. Sage university papers. Quantitative applications in the social sciences: no. 07-084. Newbury Park, Calif.: Sage Publications.
  2. O'Brien, R. G., & Kaiser, M. K. (1985). MANOVA method for analyzing repeated measures designs: an extensive primer. Psychological bulletin, 97(2), 316–333.
  3. Salkind, N. J. (2007). Encyclopedia of measurement and statistics. Thousand Oaks: Sage.