Hypothese und Signifikanz


	Zurück...

		Hypothese und Signifikanz

Da das Thema Hypothese und deren Test und der Signifikanz der anschließenden Aussage recht interessant ist, wird es auf dieser Seite in einer Übersichtsform oder hier als Video dargestellt.

Der Weg zur Hypothese:

Hypothese1
Abb. 1

Was ist eine Hypothese? Eine Hypothese ist eine mit Hilfe von Vorkenntnissen formulierte testbare Aussage (Abb. 1). Sie sollte kurz und aussagekräftig formuliert werden! Oder noch kürzer:

Eine Hypothese ist eine testbare Aussage!

Eine Hypothese besteht immer aus zwei Hypothesen! Die Nullhypothese H₀ und die Alternativhypothese H₁ (oder H_A). Die Nullhypothese H₀ ist die testbare Aussage und die Alternativhypothese H₁ ist das Gegenteil der Nullhypothese. Die Nullhypothese H₀ nimmt i. d. R. keine Beziehung zwischen Variablen (Merkmalsausprägungen, ...) bzw. keinen Unterschied zwischen Gruppen an, weil dies klar definierte Aussagen sind und somit testbar. Einfach formuliert: Die Nullhypothese H₀ besagt, dass “nichts passiert”! Das Testergebnis führt zu statistisch abgesichertem Wissen (Abb. 1).

Es werden gerichtete und ungerichtete Hypothesen unterschieden:

Ungerichtet:

Ein Hamburger von xyz beinhaltet im Durchschnitt 36 g Fleisch.

D. h., der Hamburger kann mehr oder weniger Fleisch als 36 g beinhalten.
Gerichtet:

Ein Hamburger von xyz beinhaltet im Durchschnitt weniger als 36 g Fleisch.

D. h., der Hambuger kann weniger oder gleich 36 g Fleisch beinhalten. Die Hypothese beinhaltet eine oberer Grenze, nämlich 36 g.

Hypothesentest und Signifikanz:

Zum Hypothesentest gehört die statistische Signifikanz (lat.: Deutlichkeit). Mit ihrer Hilfe werden Hypothesen abgelehnt oder angenommen. Zum Verständnis wird Abb. 1 dazu ergänzt (Abb. 2):

Abb. 2

Aus der Frage

Wie hoch ist das Fleischgewicht eines Hamburger?

und der geleisteten Vorarbeit, lässt sich folgende Hypothese ableiten:

H₀: Das Hamburgerfleischgewicht beträgt im Mittel = 36 g.

H₁: Das Hamburgerfleischgewicht beträgt im Mittel # 36 g.

Oder kürzer formuliert:

H₀: = 36 g

H₁: # 36 g

H₀ bezieht sich mit dem Mittelwert = 36 g auf die Grundgesamtheit und H₁ mit dem Mittelwert # 36 g auf die Stichprobe.

Wenn das Stichprobenergebnis stark von dem angenommenen Nullhypothesen-Wert abweicht und einen bestimmten kritischen Wert überschreitet, wird angenommen, dass die Aussage über die Grundgesamtheit (H₀) nicht stimmt.

Diese Hervorhebung ist wichtig, da wir mit unserer Fragestellung auf das Verhalten der Grundgesamtheit eingehen. Die Basis dazu ist eine mehr oder weniger große repräsentative zufällig erzeugt Stichprobe. Von dieser Stichprobe schließen wir auf die Grundgesamtheit.
Klären wir nun die Bedeutung von einem bestimmten kritischen Wert überschreiten. Dazu nehmen wir an, dass das Hamburgerfleischgewicht der Hamburger normalverteilt ist. Der Erwartungswert E unseres Stichprobenmittelwertes entspricht dem Mittelwert der Grundgesamtheit:

E() =

Mit dieser Annahme kann folgende Stichprobenverteilung konstruiert werden (Abb. 1):

Abb. 1

Abb.1 lässt aufgrund der Normalverteilungsannahme erwarten, dass Werte (das Hamburgerfleischgewicht als Messergebnis) nahe dem Erwartungswert E eine hohe Auftrittswahrscheinlichkeit und Werte weit weg von E eine kleine Auftrittswahrscheinlichkeit haben.

Die Darlegung des Themas ist noch ein wenig theoretisch, später folgt im Text ein praktisches Beispiel. Aber nun geht es erst einmal theoretisch weiter.

Wenn ein Messwert (Messwerte, Mittelwert) stark vom Erwartungswert E abweicht und dabei einen kritischen Wert überschreitet, nehmen wir an, dass unsere Nullhypothese H₀ nicht korrekt ist und lehnen sie zugunsten der Alternativhypothese H₁ ab. Der kritische Wert mit der dazugehörigen Fläche wird in Abb. 2 beispielhaft dargestellt:

Abb. 2

Der Hypothese folgend, zeigt Abb.2 zwei Ablehnungsbereiche. Das Hamburgerfleischgewicht kann schließlich nach unten und nach oben von dem erwarteten Mittelwert E() = 36 g abweichen. In diesem Fall, wird von einer ungerichteten Hypothese und einem zweiseitigen Test gesprochen.

Die Fläche in der Stichprobenverteilung Abb. 2 ist der Ablehnungsbereich und entspricht der Wahrscheinlichkeit einen Wert zu finden, der größer ist als der kritische Wert. Mit der Fläche haben wir das Signifikanzniveau festgelegt.
Das Signifikanzniveaus wird durch 2 dividiert, weil - wie erwähnt - ein ungerichteter Hypothesentest in diesem Beispiel durchgeführt wird.
Häufig wird zum Testen von Hypothesen Signifikanzniveaus von = 10% (oder auf 1 bezogen von = 0,1), = 5% (0,05) oder = 1% (0,01) verwendet. Auf Abb. 2 bezogen bedeutet das, dass mit kleiner werdenden Signifikanzniveaus der Ablehnungsbereich (die rot schraffierte Fläche) nach links und rechts verschoben wird.
Hier gilt, je sicherer die Aussage (das Testergebnis) sein soll, desto kleiner ist zu wählen. Natürlich kann aber nicht beliebig klein gewählt werden, da das Ablehnen von H₀ immer wahrscheinlicher wird. Siehe dazu Abb. 2 und diese Aussage wird grafisch sehr schön unterstützt.

Um es deutlich hervorzuheben was in Abb. 2 grafisch beschrieben ist, wird die Nullhypothese H₀ zugunsten der Alternativhypothese H₁ abgelehnt, wenn der Mittelwert unserer Hamburgerfleischgewichts-Erhebung in dem rot schraffierten Ablehnungsbereich (Signifikanzniveaus /2) in Abb. 2 liegt. Gehen wir davon aus, dass ein Signifikanzniveaus = 0,1 gewählt wurde und der Mittelwert der Gewichtserhebung bei = 29 g Fleischgewicht liegt. Damit liegt er in dem unteren Ablehnungsbereich mit /2 = 0,1 / 2 = 0,05 und H₀ wird zugunsten

verworfen (Abb. 3). Das Testergebnis ist statistisch signifikant. Andersrum, wenn das Messergebnis Mittelwert

im Annahmebereich 1-

liegt, kann die Nullhypothese H₀ nicht abgelehnt werden.

Abb. 3

Hierbei handelt es sich nur um Wahrscheinlichkeiten und es können Fehler bei der Annahme oder Ablehnung der Nullhypothese auftreten. Dieser Fehler entspricht dem gewählten Signifikanzniveau und es wird von einem Fehler 1. Art bzw. 2. Art gesprochen (Tabelle 1):

Fehler 1. Art: Die unberechtigte Ablehnung von H₀
Fehler 2. Art: Das unberechtigte Beibehalten von H₀

Testentscheidung	“Wirklichkeit”
Testentscheidung	H₀ wahr	H₀ falsch
H₀ abgelehnt	Fehler 1. Art ( -Fehler)	richtig
H₀ beibehalten	richtig	Fehler 2. Art ( -Fehler)

Tabelle 1

Haben wir aufgrund des Testergebnisses H₀ abgelehnt obwohl H₀wahr ist, liegt ein Fehler 1. Art vor. H₀ wurde fälschlicherweise verworfen. Wird H₀ nicht abgelehnt und sie ist wahr, wurde die richtige Entscheidung getroffen.
Haben wir H₀ beibehalten und sie ist nicht wahr, liegt ein Fehler 2. Art, oder auch -Fehler vor. Die Fehler 1. und 2. Art (- und -Fehler) sind voneinander abhängig. Wird der -Fehler verkleinert, wird der -Fehler vergrößert und umgekehrt. In der Praxis wird sich in der Regel mit dem Festlegen des -Fehler (der Irrtumswahrscheinlichkeit) begnügt.

Sie sollten nun eine wichtige Erkenntnis erlangt haben: Das Testergebnis ist nur ein Hinweis auf das Verhalten der Grundgesamtheit, aber kein echter Beweis!

Anwendung des Hypothesentests

Wir haben die Hypothese

H₀: = 36 g als Nullhypothese und

H₁: # 36 g als Alternativhypothese

formuliert. Das Signifikanzniveau zu dem wir die Nullhypothese H₀ ablehnen, legen wir auf 5 % fest:

= 5% bzw. = 0,05

Um H₀ zu testen, müssen Daten erhoben werden. D. h., wir müssen das Gewicht der Hamburgerfleischscheiben, auch Patty genannt, durch Wiegen ermitteln. Dazu wird die Stichprobengröße n auf n = 10 Patty’s festgelegt. Nun wird aus praktischen Gründen eine wichtige Annahme gemacht:

Es wird angenommen, dass die Patty’s eine unabhängige, repräsentative Stichprobe darstellen und die Patty-Gewichte einer Normalverteilung folgen.

Beispiel Annahme der Nullhypothese H_0:

In Tabelle 2 sind die ermittelten Patty-Gewichte aufgeführt (Datei Patty_36.csv):

Nr.	Patty-Gewicht in g
1	35,0
2	37,2
3	36,4
4	36,1
5	37,0
6	36,6
7	35,8
8	34,4
9	36,2
10	36,2

Tab. 2

Die Prüfung unserer Hypothese führen wir mit dem parametrischen (weil wir eine Annahme bezüglich der Verteilung gemacht haben) Hypothesentest t.test() aus der Statistikumgebung R durch. Da die Stichprobe mit n = 10 deutlich kleiner als n = 30 ist, kommt hier die t-Verteilung zum Zuge, weil

die Standardabweichung der Grundgesamtheit unbekannt ist und zur Schätzung der Testgröße die Standardabweichung der Stichprobe verwendet wird

und
erst ab einem Stichprobenumfang n >= 30 die t-Verteilung in die Normalverteilung, als Voraussetzung zur Anwendung des Gauß-Tests, übergeht.

Der t-Testwert wird wie folgt geschätzt (Abbildung 4):

Abb. 4

Ist der t-Testwert < als der t-Wert der t-Verteilung zum festgelegten Signifikanzniveaus und dem Freiheitsgrad f = n - 1, dann kann die Nullhypothese H₀ beibehalten werden (Abbildung 5, siehe auch Sollwert-t-Test):

Abb. 5

Führen wir den t-Test endlich mit R durch. Die Patty-Gewichte aus Tabelle 2 sind im Datenobjekt Patty_36g gespeichert und das Hamburgerfleischgewicht der Nullhypothese H₀ wird als Argument mu = 36 der Funktion t.test übergeben:

> t.test(Patty_36g, mu = 36)

One Sample t-test

data: Patty_36g
t = 0.33313, df = 9, p-value = 0.7467
alternative hypothesis: true mean is not equal to 36
95 percent confidence interval:
35.47885 36.70115
sample estimates:
mean of x
36.09

Wie wird die Ausgabe (blau) der R-Funktion t.test interpretiert? Die Nullhypothese H₀ kann nicht abgelehnt werden, weil

der geschätzte t-Wert t = 0.33313 hinreichend klein ist (siehe t-Verteilung) und
der p-Wert (p-value) mit 0.7467 deutlich über dem Signifikanzniveau = 0,05 liegt:

0,7467 / 2 = 0,37335 (weil ungerichtet (zweiseitig))
0,373 > 0,05/2 (weil ungerichtet (zweiseitig))

Mit diesen t- und p-Werten liegt der Mittelwert der Messreihe Patty_36g sehr gut im 1- der Abbildung 2.

Zusätzlich wird der Vertrauensbereich (confidence interval) und der geschätzte Mittelwert der Stichprobe mit mean of x 36.09 ausgegeben.

Beispiel Rückweisung der Nullhypothese H₀:

Um das Thema abzurunden, folgt nun ein Beispiel, bei dem die Nullhypothese H₀ abgelehnt werden muss. In Tabelle 3 sind Patty-Gewichte einer weiteren Stichprobenerhebung aufgeführt (Datei Patty_29.csv):

Nr.	Patty-Gewicht in g
1	29,3
2	29,9
3	28,9
4	28,0
5	28,8
6	29,7
7	30,9
8	29,5
9	29,7
10	29,7

Tab. 3

Die Patty-Gewichte aus Tabelle 3 sind im Datenobjekt Patty_29g gespeichert und das Hamburgerfleischgewicht der Nullhypothese H₀ wird als Argument mu = 36 der Funktion t.test übergeben:

> t.test(Patty_29g, mu = 36)

One Sample t-test

data: Patty_29g
t = -26.921, df = 9, p-value = 6.518e-10
alternative hypothesis: true mean is not equal to 36
95 percent confidence interval:
28.88877 29.99123
sample estimates:
mean of x
29.44

Aufgrund des t-Wertes t = -26.921 und des p-Wertes mit p-value = 6.518e-10 muss die Nullhypothese H₀ zugunsten der Alternativhypothese H₁ abgelehnt werden. Zur Veranschaulichung dient hierzu Abb. 3.

Ich freue mich, wenn durch diesen Beitrag das Thema Hypothese und Signifikanz ein wenig klarer geworden ist und Sie dadurch sicherer in der Anwendung und Interpretation sind!


	Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?

Impressum

Datenschutz