Zurück...

Wilcoxon-Test, Vorzeichen-Rang-Test

Tests für den Vergleich zweier verbundener Stichproben - dem Vergleich gepaarter Beobachtungen - ist der t-Test bei normalverteilten Differenzen und der Vorzeichen-Rang-Test von Wilcoxon. Der Wilcoxon-Test ist ein nichtparametrischer Test, d. h., es wird keine Annahme über die zugrundeliegende Verteilung als Voraussetzung gemacht. Die Verteilung des zugrundeliegenden Merkmals steht nicht im Vordergrund, sondern die symmetrische Verteilung der Paardifferenzen der Merkmale um den Median.
Es wird für diesen Test dennoch vorausgesetzt, dass die dem Merkmal(en) zugrundeliegende Verteilung symmetrisch ist. Damit lässt sich der Wilcoxon-Test auch auf normalverteilte Beobachtungen anwenden.

Der Wilcoxon-Test prüft, ob die Differenzen paarweise angeordneter Beobachtungen symmetrisch mit dem Median gleich Null verteilt sind. Die Nullhypothese H0 lautet also

H0 Differenz = 0.

Die Alternativhypothese H1, das der Median der Differenzen ungleich Null ist, ist demnach

H1: Differenz # 0.

Trifft die Alternativhypothese H1 zu, ist die Grundgesamtheit nicht symmetrisch in Bezug auf den Median oder den Stichproben liegen unterschiedliche Verteilungen zugrunde. Darauf basierend, lassen sich die Hypothesen auch wie folgt formulieren:

Die Nullhypothese

H0:  die Verteilungsfunktionen der gepaarten Beobachtungen X und Y sind indentisch

und die Alternativhypothese

H1: die Verteilungsfunktionen unterscheiden sich in ihrer Lage oder Form.

Testdurchführung

Der Test wird in mehreren Schritten durchgeführt:

  • Von den gepaarten Beobachtungen Xi und Yi wird die Differenz Di ...

 

  • ... und anschließend der Absolutbetrag gebildet:


  • Die absoluten Beträge werden aufsteigend geordnet. Der kleinste Betrag erhält die Rangzahl Ri=1 = 1 und der größte Betrag die größte Rangzahl Ri=n = n (n: Stichprobenumfang).
  • Zu jeder Rangzahl Ri wird festgehalten, ob die zugehörige Differenz ein positives oder negatives Vorzeichen aufweist.
     
  • Anschließend wird die Summe der positiven und negativen Rangzahlen Ri gebildet:



    An dieser Stelle hilft folgende Überlegung bezüglich der Testkonstruktion (siehe obige Hypothesenbildung) weiter: Trifft die Nullhypothese H0 zu, sollten die positiven und negativen Rangsummen RSum etwa gleich groß sein. Denn dann kann auch von einer Symmetrie der Verteilung um den Median ausgegangen werden.
  • Als Prüfgröße (Testgröße) wird die kleinere der beiden Rangsummen RSum benutzt:



    Die Prüfgröße PG kann über



    geprüft werden.

Die Nullhypothese H0 wird dann verworfen, wenn die Prüfgröße PG kleiner oder gleich dem Vergleichswert der RTabelle ist:

Lexikon: Signifikanzniveau
  • Bei der Testdurchführung treten gelegentlich sogenannte Bindungen oder auch Ties genannt auf. Eine Art Bindung ist, wenn die Differenz Xi - Yi = 0 ist. Die andere Art der Bindung liegt vor, wenn gleich große Differenzen vorliegen.
    Ist die Differenz D = 0, wird die entsprechend Beobachtung nicht berücksichtigt und der Stichprobenumfang n verringert. Kommt also diese Bindung (Differenz = 0) einmal vor, entspricht der Stichprobenumfang n dann n = n - 1. Bedenkenswert ist hier allerdings, dass dann Beobachtungen, die für die Nullhypothese H0 sprechen, nicht berücksichtigt werden!

    Liegen gleich große Differenzen vor, werden Duchschnittsränge gebildet:
  • Di:

    1,5

    2,5

    3,5

    3,5

    3,5

    4,5

    R, Bindung ignoriert:

    1

    2

    3

    4

    5

    6

    R mit Durchschnittsr.:

    1

    2

    4

    4

    4

    6

    Für die gelb markierten Ränge wird der Durchschnittsrang gebildet: (3+4+5)/3=4. Die Rangbildung wird dann ab dem 6. Rang fortgesetzt. Rang 3 und 5 sind in den Durchschnittsrang eingeflossen und können natürlich nicht mehr verwendet werden.

    Zur Behandlung von Bindungen werden verschiedene Methoden vorgeschlagen. Möchten Sie sich in das Thema vertiefen, empfehle ich Bortz, Lienert und Boehnke.

Beispiel

Wir gehen von folgendem Beispiel aus:

Im obigen Beispiel sind 3 gleiche absolute Differenzen enthalten. Die gelben Zellen zeigen den Durchschnittsrang . Die Verteilung zwischen den positiven und negativen Rangzahlen ist nicht identisch, aber ob hier ein statistisch signifikanter Unterschied vorliegt, also H0 abgelehnt werden muss, soll wie folgt geprüft werden:

      • Die Prüfgröße PG entspricht der kleinsten Rangzahl: PG = 24
      • Der Stichprobenumfang n für die gepaarten Beobachtungen ist n = 10
      • Der Vergleichswert aus der Tabelle ist R(10; 0,05) = 8

Nun haben wir alle Daten vorliegen und prüfen die Nullhypothese H0, also ob die gepaarten Beobachtungen X und Y eine identische Verteilungsfunktion besitzen:

H0:   PG > R(10; 0,05) = 24 > 8

Mit einem Signifikanzniveau von 5% trifft die Nullhypothese H0 zu!

Dieser Test kann natürlich auch mit dem Statistikprogramm R durchgeführt werden!

Die X- und Y-Variablen wurden in die R-Umgebung als Objekt Daten geladen.

Über die Funktion wilcox.test() mit dem Argument paired = TRUE wird in diesem Beispiel der Wilcoxon-Test durchgeführt:

Die Ausgabe der Funktion ist deutlich: V = 24 ist die Summe der positiven Rangzahlen und die Größe des p-Wertes (p-value = 0.7592) macht deutlich, dass die Nullhypothese H0 nicht abgelehnt werden kann! Die Warnmeldung ist verständlich, es liegen ja tatsächlich Bindungen vor! Dadurch kann der p-Wert auch nur geschätzt werden!

Standardmäßig wird der Vertrauensbereich P mit P = 0.95 vorgegeben (conf.level = 0.95), was einem Signifikanzniveau von 0,05 entspricht.

Möchten Sie den Wilcoxon-Test mit einer exakten Berechnung des p-Wertes durchführen, können Sie z. B. die Funktion wilcox_test()aus dem Paket coin nutzen!

Seitenanfang

Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?