Zurück...

Hypothese und Signifikanz

Da das Thema Hypothese und deren Test und der Signifikanz der anschließenden Aussage recht interessant ist, wird es auf dieser Seite in einer Übersichtsform oder hier als Video dargestellt.

Der Weg zur Hypothese:

Hypothese1
Abb. 1

Was ist eine Hypothese? Eine Hypothese ist eine mit Hilfe von Vorkenntnissen formulierte testbare Aussage (Abb. 1). Sie sollte kurz und aussagekräftig formuliert werden! Oder noch kürzer:

Eine Hypothese ist eine testbare Aussage!

Eine Hypothese besteht immer aus zwei Hypothesen! Die Nullhypothese H0 und die Alternativhypothese H1 (oder HA). Die Nullhypothese H0 ist die testbare Aussage und die Alternativhypothese H1 ist das Gegenteil der Nullhypothese. Die Nullhypothese H0 nimmt i. d. R. keine Beziehung zwischen Variablen (Merkmalsausprägungen, ...) bzw. keinen Unterschied zwischen Gruppen an, weil dies klar definierte Aussagen sind und somit testbar. Einfach formuliert: Die Nullhypothese H0 besagt, dass “nichts passiert”! Das Testergebnis führt zu statistisch abgesichertem Wissen (Abb. 1).

Es werden gerichtete und ungerichtete Hypothesen unterschieden:

    • Ungerichtet:

      Ein Hamburger von xyz beinhaltet im Durchschnitt 36 g Fleisch.

      D. h., der Hamburger kann mehr oder weniger Fleisch als 36 g beinhalten.
       
    • Gerichtet:

      Ein Hamburger von xyz beinhaltet im Durchschnitt weniger als 36 g Fleisch.

      D. h., der Hambuger kann weniger oder gleich 36 g Fleisch beinhalten. Die Hypothese beinhaltet eine oberer Grenze, nämlich 36 g.

Hypothesentest und Signifikanz:

Zum Hypothesentest gehört die statistische Signifikanz (lat.: Deutlichkeit). Mit ihrer Hilfe werden Hypothesen abgelehnt oder angenommen. Zum Verständnis wird Abb. 1 dazu ergänzt (Abb. 2):

Hypothese2
Abb. 2

Aus der Frage

Wie hoch ist das Fleischgewicht eines Hamburger?

 und der geleisteten Vorarbeit, lässt sich folgende Hypothese ableiten:

        H0: Das Hamburgerfleischgewicht beträgt im Mittel = 36 g.

        H1: Das Hamburgerfleischgewicht beträgt im Mittel # 36 g.

Oder kürzer formuliert:

              H0mü-Sign = 36 g

              H1Mittelwert_Zeichen # 36 g

H0 bezieht sich mit dem Mittelwert mü-Sign = 36 g auf die Grundgesamtheit und H1 mit dem Mittelwert  Mittelwert_Zeichen # 36 g auf die Stichprobe.

    Wenn das Stichprobenergebnis Mittelwert_Zeichen stark von dem angenommenen Nullhypothesen-Wert abweicht und einen bestimmten kritischen Wert überschreitet, wird angenommen, dass die Aussage über die Grundgesamtheit (H0) nicht stimmt.

Diese Hervorhebung ist wichtig, da wir mit unserer Fragestellung auf das Verhalten der Grundgesamtheit eingehen. Die Basis dazu ist eine mehr oder weniger große repräsentative zufällig erzeugt Stichprobe. Von dieser Stichprobe schließen wir auf die Grundgesamtheit.
Klären wir nun die Bedeutung von einem bestimmten kritischen Wert überschreiten. Dazu nehmen wir an, dass das Hamburgerfleischgewicht der Hamburger normalverteilt ist. Der Erwartungswert E unseres Stichprobenmittelwertes Mittelwert_Zeichen entspricht dem Mittelwert mü-Sign der Grundgesamtheit:

E(Mittelwert_Zeichen) = mü-Sign

Mit dieser Annahme kann folgende Stichprobenverteilung konstruiert werden (Abb. 1):

Hypothese_Abb1
Abb. 1

Abb.1 lässt aufgrund der Normalverteilungsannahme erwarten, dass Werte (das Hamburgerfleischgewicht als Messergebnis) nahe dem Erwartungswert E eine hohe Auftrittswahrscheinlichkeit und Werte weit weg von E eine kleine Auftrittswahrscheinlichkeit haben.

Die Darlegung des Themas ist noch ein wenig theoretisch, später folgt im Text ein praktisches Beispiel. Aber nun geht es erst einmal theoretisch weiter.

Wenn ein Messwert (Messwerte, Mittelwert) stark vom Erwartungswert E abweicht und dabei einen kritischen Wert überschreitet, nehmen wir an, dass unsere Nullhypothese H0 nicht korrekt ist und lehnen sie zugunsten der Alternativhypothese H1 ab. Der kritische Wert mit der dazugehörigen Fläche alpha-Zeichen wird in Abb. 2 beispielhaft dargestellt:

Hypothese_Abb2
Abb. 2

Der Hypothese folgend, zeigt Abb.2 zwei Ablehnungsbereiche. Das Hamburgerfleischgewicht kann schließlich nach unten und nach oben von dem erwarteten Mittelwert E(Mittelwert_Zeichen) = 36 g abweichen. In diesem Fall, wird von einer ungerichteten Hypothese und einem zweiseitigen Test gesprochen.

Die Fläche alpha-Zeichen in der Stichprobenverteilung  Abb. 2 ist der Ablehnungsbereich und entspricht der Wahrscheinlichkeit einen Wert zu finden, der größer ist als der kritische Wert. Mit der Fläche alpha-Zeichen haben wir das Signifikanzniveau alpha-Zeichen festgelegt.
Das Signifikanzniveaus alpha-Zeichen wird durch 2 dividiert, weil - wie erwähnt - ein ungerichteter Hypothesentest in diesem Beispiel durchgeführt wird.
Häufig wird zum Testen von Hypothesen Signifikanzniveaus von alpha-Zeichen = 10% (oder auf 1 bezogen von alpha-Zeichen = 0,1),  alpha-Zeichen = 5% (0,05) oder alpha-Zeichen = 1% (0,01) verwendet. Auf Abb. 2 bezogen bedeutet das, dass mit kleiner werdenden Signifikanzniveaus der Ablehnungsbereich (die rot schraffierte Fläche) nach links und rechts verschoben wird.
Hier gilt, je sicherer die Aussage (das Testergebnis) sein soll, desto kleiner ist alpha-Zeichen zu wählen. Natürlich kann alpha-Zeichen aber nicht beliebig klein gewählt werden, da das Ablehnen von H0 immer wahrscheinlicher wird. Siehe dazu Abb. 2 und diese Aussage wird grafisch sehr schön unterstützt.

Um es deutlich hervorzuheben was in Abb. 2 grafisch beschrieben ist, wird die Nullhypothese H0 zugunsten der Alternativhypothese H1 abgelehnt, wenn der Mittelwert Mittelwert_Zeichen unserer Hamburgerfleischgewichts-Erhebung in dem rot schraffierten Ablehnungsbereich (Signifikanzniveaus alpha-Zeichen/2) in Abb. 2 liegt. Gehen wir davon aus, dass ein Signifikanzniveaus alpha-Zeichen= 0,1 gewählt wurde und der Mittelwert der Gewichtserhebung bei Mittelwert_Zeichen= 29 g Fleischgewicht liegt. Damit liegt er in dem unteren Ablehnungsbereich mit  alpha-Zeichen/2 = 0,1 / 2 = 0,05 und H0 wird zugunsten

Hypothese3


verworfen (Abb. 3). Das Testergebnis ist statistisch signifikant. Andersrum, wenn das Messergebnis Mittelwert Mittelwert_Zeichen im Annahmebereich 1-alpha-Zeichen liegt, kann die Nullhypothese H0 nicht abgelehnt werden.
Hypothese_Abb3
Abb. 3

Hierbei handelt es sich nur um Wahrscheinlichkeiten und es können Fehler bei der Annahme oder Ablehnung der Nullhypothese auftreten. Dieser Fehler entspricht dem gewählten Signifikanzniveau alpha-Zeichen und es wird von einem Fehler 1. Art bzw. 2. Art gesprochen (Tabelle 1):

      • Fehler 1. Art: Die unberechtigte Ablehnung von H0
      • Fehler 2. Art: Das unberechtigte Beibehalten von H0

Testentscheidung

“Wirklichkeit”

H0 wahr

H0 falsch

H0 abgelehnt

Fehler 1. Art
( alpha-Zeichen-Fehler)

richtig

H0 beibehalten

richtig

Fehler 2. Art
( Beta-Symbol-Fehler)

Tabelle 1

Haben wir aufgrund des Testergebnisses H0 abgelehnt obwohl H0 wahr ist, liegt ein Fehler 1. Art vor. H0 wurde fälschlicherweise verworfen. Wird H0 nicht abgelehnt und sie ist wahr, wurde die richtige Entscheidung getroffen.
Haben wir H0 beibehalten und sie ist nicht wahr, liegt ein Fehler 2. Art, oder auch Beta-Symbol-Fehler vor. Die Fehler 1. und 2. Art (alpha-Zeichen- und Beta-Symbol-Fehler) sind voneinander abhängig. Wird der alpha-Zeichen-Fehler verkleinert, wird der Beta-Symbol-Fehler vergrößert und umgekehrt. In der Praxis wird sich in der Regel mit dem Festlegen des alpha-Zeichen-Fehler (der Irrtumswahrscheinlichkeit) begnügt.

Sie sollten nun eine wichtige Erkenntnis erlangt haben: Das Testergebnis ist nur ein Hinweis auf das Verhalten der Grundgesamtheit, aber kein echter Beweis!

Anwendung des Hypothesentests

Wir haben die Hypothese

            H0mü-Sign = 36 g als Nullhypothese und

            H1Mittelwert_Zeichen # 36 g als Alternativhypothese

formuliert. Das Signifikanzniveau zu dem wir die Nullhypothese H0 ablehnen, legen wir auf 5 % fest:

            alpha-Zeichen = 5% bzw. alpha-Zeichen = 0,05

Um H0 zu testen, müssen Daten erhoben werden. D. h., wir müssen das Gewicht der Hamburgerfleischscheiben, auch Patty genannt, durch Wiegen ermitteln. Dazu wird die Stichprobengröße n auf n = 10 Patty’s festgelegt. Nun wird aus praktischen Gründen eine wichtige Annahme gemacht:

  • Es wird angenommen, dass die Patty’s eine unabhängige, repräsentative Stichprobe darstellen und die Patty-Gewichte einer Normalverteilung folgen.

Beispiel Annahme der Nullhypothese H0:

In Tabelle 2 sind die ermittelten Patty-Gewichte aufgeführt (Datei Patty_36.csv):

Nr.

Patty-Gewicht in g

1

35,0

2

37,2

3

36,4

4

36,1

5

37,0

6

36,6

7

35,8

8

34,4

9

36,2

10

36,2

Tab. 2

Die Prüfung unserer Hypothese führen wir mit dem parametrischen (weil wir eine Annahme bezüglich der Verteilung gemacht haben) Hypothesentest t.test() aus der Statistikumgebung R durch. Da die Stichprobe mit n = 10 deutlich kleiner als n = 30 ist, kommt hier die t-Verteilung zum Zuge, weil

      • die Standardabweichung der Grundgesamtheit unbekannt ist und zur Schätzung der Testgröße die Standardabweichung der Stichprobe verwendet wird

        und
         
      • erst ab einem Stichprobenumfang n >= 30 die t-Verteilung in die Normalverteilung, als Voraussetzung zur Anwendung des Gauß-Tests, übergeht.

Der t-Testwert wird wie folgt geschätzt (Abbildung 4):

Hypothese_Abb4
Abb. 4

Ist der t-Testwert < als der t-Wert der t-Verteilung zum festgelegten Signifikanzniveaus und dem Freiheitsgrad f = n - 1, dann kann die Nullhypothese H0 beibehalten werden (Abbildung 5, siehe auch Sollwert-t-Test):

Hypothese_Abb5
Abb. 5

Führen wir den t-Test endlich mit R durch. Die Patty-Gewichte aus Tabelle 2 sind im Datenobjekt Patty_36g gespeichert und das Hamburgerfleischgewicht der Nullhypothese H0 wird als Argument mu = 36 der Funktion t.test übergeben:

          > t.test(Patty_36g, mu = 36)

                  One Sample t-test

          data:  Patty_36g
          t = 0.33313, df = 9, p-value = 0.7467
          alternative hypothesis: true mean is not equal to 36
          95 percent confidence interval:
           35.47885 36.70115
          sample estimates:
          mean of x
              36.09

Wie wird die Ausgabe (blau) der R-Funktion t.test interpretiert? Die Nullhypothese H0 kann nicht abgelehnt werden, weil

      • der geschätzte t-Wert t = 0.33313 hinreichend klein ist (siehe t-Verteilung) und
      • der p-Wert (p-value) mit 0.7467 deutlich über dem Signifikanzniveau alpha-Zeichen = 0,05 liegt:
          • 0,7467 / 2 = 0,37335 (weil ungerichtet (zweiseitig))
          • 0,373 > 0,05/2 (weil ungerichtet (zweiseitig))

        Mit diesen t- und p-Werten liegt der Mittelwert der Messreihe Patty_36g sehr gut im 1-alpha-Zeichen der Abbildung 2.

Zusätzlich wird der Vertrauensbereich (confidence interval) und der geschätzte Mittelwert der Stichprobe mit mean of x 36.09 ausgegeben.

Beispiel Rückweisung der Nullhypothese H0:

Um das Thema abzurunden, folgt nun ein Beispiel, bei dem die Nullhypothese H0 abgelehnt werden muss. In Tabelle 3 sind Patty-Gewichte einer weiteren Stichprobenerhebung aufgeführt (Datei Patty_29.csv):

Nr.

Patty-Gewicht in g

1

29,3

2

29,9

3

28,9

4

28,0

5

28,8

6

29,7

7

30,9

8

29,5

9

29,7

10

29,7

Tab. 3

Die Patty-Gewichte aus Tabelle 3 sind im Datenobjekt Patty_29g gespeichert und das Hamburgerfleischgewicht der Nullhypothese H0 wird als Argument mu = 36 der Funktion t.test übergeben:

          > t.test(Patty_29g, mu = 36)

                  One Sample t-test

          data:  Patty_29g
          t = -26.921, df = 9, p-value = 6.518e-10
          alternative hypothesis: true mean is not equal to 36
          95 percent confidence interval:
           28.88877 29.99123
          sample estimates:
          mean of x
              29.44

Aufgrund des t-Wertes t = -26.921 und des p-Wertes mit p-value = 6.518e-10 muss die Nullhypothese H0 zugunsten der Alternativhypothese H1 abgelehnt werden. Zur Veranschaulichung dient hierzu Abb. 3.

Ich freue mich, wenn durch diesen Beitrag das Thema Hypothese und Signifikanz ein wenig klarer geworden ist und Sie dadurch sicherer in der Anwendung und Interpretation sind!

Seitenanfang

Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?

Impressum

Datenschutz