Stochastik

Dimensionsreduktion ist eine Sammlung statistischer Methoden, die die Dimension der Daten reduziert und gleichzeitig relevante Informationen bewahrt.

Hochdimensionale Daten sind bei Regierungsbehörden, wissenschaftlichen Erhebungen und in Industrieunternehmen weit verbreitet. Die hohe Dimension und das große Datenvolumen werfen jedoch mindestens zwei Fragen auf:

In der Statistik sind die Freiheitsgrade ein Maß für die Genauigkeit, die erforderlich ist, um einen Parameter zu schätzen (d.h. eine Größe, die einen bestimmten Aspekt der Bevölkerung repräsentiert). Freiheitsgrade drücken die Anzahl der unabhängigen Faktoren aus, auf denen die Parameterschätzung basiert und sind oft eine Funktion der Stichprobengröße. Generell steigt die Anzahl der Freiheitsgrade mit zunehmender Stichprobengröße und sinkt mit der Anzahl der geschätzten Parameter.

Damit sich die Ergebnisse eines Messinstruments (Scores) für die Grundlagenforschung oder die angewandte Forschung als nützlich erweisen, ist es von entscheidender Bedeutung, dass Messinstrument reliabel ist.

Reliabilität ist – rein theoretisch betrachtet – das Verhältnis der wahren Werte zu der Varianz der beobachteten Werte. Die Differenz ist die Fehlervarianz. Fehlervarianz ist hier nur der unsystematische Fehler und beinhaltet keinen systematischen Fehler.

Subscribe to Stochastik