Zurück...

-Test, Chi2-Test, Chiquadrat-Test

Der -Test ist ein Anpassungstest. Mit ihm lässt sich prüfen, ob die beobachtete Verteilung einer vorgegebenen Verteilung entspricht.
Dieser Test ist anwendbar für kategoriale oder auch für kontinuierliche  Merkmale die klassifiziert wurden.

Kategoriale Merkmale

Hinweis: Schauen Sie zu diesem Würfel-Beispiel auch das Video Chi2 Anpassungstest auf YouTube!

Zur Darlegung des -Tests für kategoriale Merkmale gehen wir von diesem kleinen Würfelexperiment aus (Bild 1):

Bild 1

Erwartet wird die Gleichverteilung der gewürfelten Zahlen für die 290 Würfe und dieser Erwartungswert hE über die 6 Kategorien beträgt für dieses Beispiel

hE = 290 / 6 = 48,33.

Mit dem -Test kann nun geprüft werden, ob die im Bild 1 dargestellte reale Verteilung über die Kategorien hK dem Erwartungswert hE, also der Gleichverteilung, entspricht.
Wir bezeichnen

hK = hE als Nullhypothese H0 und

hK # hE als Alternativhypothese H1.

Wird jedes Auftreten der Ausprägung von X auf Annahme oder Ablehnung (1 oder nicht 1 gewürfelt) hin betrachtet, kann von einer Binomialverteilung ausgegangen werden:

hi ~ B(n, hE)

D. h., dass für jede Kategorie (i = 1...6) so die Nullhypothese H0 geprüft werden kann. Wie oben erwähnt, kann der Anpassungstest mit dem -Test direkt für alle Kategorien Xn durchgeführt werden. Dazu wird die quadrierte Differenz von hi und hE gebildet und normiert:

F 1

Die Summe dieser normierten Abweichung stellt dann die -Prüfgröße dar:

F 2

Für kategoriale Merkmale gilt die Ablehnung der Nullhypothese H0 (keine Gleichverteilung), wenn

F 3

ist.
Die Berechung des -Wertes für obiges Beispiel (Bild 1) zeigt Bild 2 (OpenOffice-Tabelle):

Bild 2, OpenOffice-Tabellenblatt

Das 0,95-Quantil der -Verteilung mit 5 Freiheitsgeraden (k = 6-1) ist

 0,95 (5) = 11,07    (siehe Tabelle).

Da

1,559 < 11,07

kann die Nullhypothese nicht abgelehnt werden, d. h., die Verteilung der “Augenzahl” des Würfels entspricht der Erwartung. Der Würfel “taugt” zum Spielen!

Kontinuierliche Merkmale

Der -Test kann auch zur Anpassungsprüfung für kontinuierliche Merkmale eingesetzt werden (siehe auch Schiefe und Wölbung).
Dazu ist es notwendig, die Merkmalsausprägung in Klassen zu gruppieren. D. h., es wird eine bestimmte Anzahl Intervalle (Klassen) in dem Spannweitenbereich der Merkmalsausprägung gebildet und die einzelnen Ausprägungen dann dem jeweiligen Intervall zugeordnet. Nach der Zuordnung wird dann, wie im Bild 2 dargestellt, die Häufigkeit der Zuordnung pro Klasse gezählt. (Hinweis: Zum Test einer geringen Anzahl Merkmale siehe Kolmogorov-Smirnov-Test.)

In diesem Beispiel soll mit dem Anpassungstest geprüft werden, ob die klassierten Beobachtungen (Bild 3) angenähert einer Normalverteilung folgen.
Dazu werden die jeweiligen Klassenmitten (Spalte B), um den Flächenanteil der Standardnormalverteilung berechnen zu können, in z-Werte transformiert (Bild 3, Spalte H):

F 4

Im nächsten Schritt wird der Flächenanteil der Standardnormalverteilung, entweder aus Tabellen oder - wie in diesem Beispiel - über entsprechende R-Funktion, ermittelt (Bild 3, Spalte I). Über die Dichteverteilung (Bild 3, Spalte I) wird nach hE = Dichteverteilung * K die erwartete Häufigkeit hE ermittelt (Bild 3, Spalte J). Die normierte Differenz nach F1 wird in Spalte K, Bild 3, berechnet:

Bild 3, Excel-Tabellenblatt

Die Berechnung des Chiquadratprüfwertes als Summe über die Zellen K5-K9 sehen Sie in der Zelle K12 mit dem Betrag 0,799.
Zur Ermittlung des Vergleichswertes der -Verteilung wird der Freiheitsgrad benötigt. Hier muss nun im Unterschied zu F3 die Anzahl der geschätzten Parameter berücksichtigt werden. Um die z-Transformation (F4) durchführen zu können, musste der Mittelwert und die Standardabweichung geschätzt werden. Das bedeutet nun, dass der Freiheitsgrad durch k-1-2 (2 für Mittelwert und Standardabweichung) bestimmt wird:

          k: 5 Klassen
          Freiheitsgrad = 5 -1 - 2 = 2

Mit

 0,95 (2) = 5,99    (siehe Tabelle).

ist ist die Hypothese, dass die Beobachtungen einer Normalverteilung folgen, nicht abzulehnen:

0,799 < 5,99

Zur Abrundung der grafische Vergleich zwischen beobachteter und erwarteter Häufigkeit:

F 5

Seitenanfang

Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?

Impressum

Datenschutz