Chi-Quadrat-Test




			*Zurück...*

			-Test, Chi²-Test, Chiquadrat-Test

		Der -Test ist ein Anpassungstest. Mit ihm lässt sich prüfen, ob die beobachtete Verteilung einer vorgegebenen Verteilung entspricht. Dieser Test ist anwendbar für kategoriale oder auch für kontinuierliche Merkmale die klassifiziert wurden. Kategoriale Merkmale Hinweis: Schauen Sie zu diesem Würfel-Beispiel auch das Video *Chi2 Anpassungstest* auf YouTube! Zur Darlegung des -Tests für kategoriale Merkmale gehen wir von diesem kleinen Würfelexperiment aus (Bild 1):


		Bild 1

	Erwartet wird die Gleichverteilung der gewürfelten Zahlen für die 290 Würfe und dieser Erwartungswert h_E über die 6 Kategorien beträgt für dieses Beispiel

h_E = 290 / 6 = 48,33.


	Mit dem -Test kann nun geprüft werden, ob die im Bild 1 dargestellte reale Verteilung über die Kategorien h_K dem Erwartungswert h_E, also der Gleichverteilung, entspricht. Wir bezeichnen

h_K = h_E als Nullhypothese H₀und

h_K # h_E als Alternativhypothese H_1.


	Wird jedes Auftreten der Ausprägung von X auf Annahme oder Ablehnung (1 oder nicht 1 gewürfelt) hin betrachtet, kann von einer Binomialverteilung ausgegangen werden:


	h_i ~ B(n, h_E)


	D. h., dass für jede Kategorie (i = 1...6) so die Nullhypothese H₀ geprüft werden kann. Wie oben erwähnt, kann der Anpassungstest mit dem -Test direkt für alle Kategorien X_n durchgeführt werden. Dazu wird die quadrierte Differenz von h_i und h_E gebildet und normiert:


	*F 1*


	Die Summe dieser normierten Abweichung stellt dann die -Prüfgröße dar:


	*F 2*


	Für kategoriale Merkmale gilt die Ablehnung der Nullhypothese H₀ (keine Gleichverteilung), wenn


	*F 3*


	ist. Die Berechung des -Wertes für obiges Beispiel (Bild 1) zeigt Bild 2 (OpenOffice-Tabelle):


		Bild 2, OpenOffice-Tabellenblatt

	Das 0,95-Quantil der -Verteilung mit 5 Freiheitsgeraden (k = 6-1) ist

	_{0,95 (5)} = 11,07 (siehe Tabelle).

Da

1,559 < 11,07

kann die Nullhypothese nicht abgelehnt werden, d. h., die Verteilung der “Augenzahl” des Würfels entspricht der Erwartung. Der Würfel “taugt” zum Spielen! Kontinuierliche Merkmale Der -Test kann auch zur Anpassungsprüfung für kontinuierliche Merkmale eingesetzt werden (siehe auch Schiefe und Wölbung). Dazu ist es notwendig, die Merkmalsausprägung in Klassen zu gruppieren. D. h., es wird eine bestimmte Anzahl Intervalle (Klassen) in dem Spannweitenbereich der Merkmalsausprägung gebildet und die einzelnen Ausprägungen dann dem jeweiligen Intervall zugeordnet. Nach der Zuordnung wird dann, wie im Bild 2 dargestellt, die Häufigkeit der Zuordnung pro Klasse gezählt. (Hinweis: Zum Test einer geringen Anzahl Merkmale siehe Kolmogorov-Smirnov-Test.)


	In diesem Beispiel soll mit dem Anpassungstest geprüft werden, ob die klassierten Beobachtungen (Bild 3) angenähert einer Normalverteilung folgen. Dazu werden die jeweiligen Klassenmitten (Spalte B), um den Flächenanteil der Standardnormalverteilung berechnen zu können, in z-Werte transformiert (Bild 3, Spalte H):


	*F 4*

Im nächsten Schritt wird der Flächenanteil der Standardnormalverteilung, entweder aus Tabellen oder - wie in diesem Beispiel - über entsprechende R-Funktion, ermittelt (Bild 3, Spalte I). Über die Dichteverteilung (Bild 3, Spalte I) wird nach h_E = Dichteverteilung * K die erwartete Häufigkeit h_E ermittelt (Bild 3, Spalte J). Die normierte Differenz nach F1 wird in Spalte K, Bild 3, berechnet:


		Bild 3, Excel-Tabellenblatt

Die Berechnung des Chiquadratprüfwertes als Summe über die Zellen K5-K9 sehen Sie in der Zelle K12 mit dem Betrag 0,799. Zur Ermittlung des Vergleichswertes der -Verteilung wird der Freiheitsgrad benötigt. Hier muss nun im Unterschied zu F3 die Anzahl der geschätzten Parameter berücksichtigt werden. Um die z-Transformation (F4) durchführen zu können, musste der Mittelwert und die Standardabweichung geschätzt werden. Das bedeutet nun, dass der Freiheitsgrad durch k-1-2 (2 für Mittelwert und Standardabweichung) bestimmt wird:

k: 5 Klassen Freiheitsgrad = 5 -1 - 2 = 2



Mit

	_{0,95 (2)} = 5,99 (siehe Tabelle).

	ist ist die Hypothese, dass die Beobachtungen einer Normalverteilung folgen, nicht abzulehnen:

0,799 < 5,99

Zur Abrundung der grafische Vergleich zwischen beobachteter und erwarteter Häufigkeit:


	*F 5*


	Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?

Impressum

Datenschutz