Hypothese und Signifikanz |
Da das Thema Hypothese und deren Test und der Signifikanz der anschließenden Aussage recht interessant ist, wird es auf dieser Seite in einer Übersichtsform oder hier als Video dargestellt. Der Weg zur Hypothese:
Was ist eine Hypothese? Eine Hypothese ist eine mit Hilfe von Vorkenntnissen formulierte testbare Aussage (Abb. 1). Sie sollte kurz und aussagekräftig formuliert werden! Oder noch kürzer: Eine Hypothese ist eine testbare Aussage! Eine Hypothese besteht immer aus zwei Hypothesen! Die Nullhypothese H0 und die Alternativhypothese H1 (oder HA). Die Nullhypothese H0 ist die testbare Aussage und die Alternativhypothese H1 ist das Gegenteil der Nullhypothese. Die Nullhypothese H0 nimmt i. d. R. keine Beziehung zwischen Variablen (Merkmalsausprägungen, ...) bzw. keinen Unterschied zwischen Gruppen an, weil dies klar definierte Aussagen sind und somit testbar. Einfach formuliert: Die Nullhypothese H0 besagt, dass “nichts passiert”! Das Testergebnis führt zu statistisch abgesichertem Wissen (Abb. 1). Es werden gerichtete und ungerichtete Hypothesen unterschieden:
Hypothesentest und Signifikanz: Zum Hypothesentest gehört die statistische Signifikanz (lat.: Deutlichkeit). Mit ihrer Hilfe werden Hypothesen abgelehnt oder angenommen. Zum Verständnis wird Abb. 1 dazu ergänzt (Abb. 2): Wie hoch ist das Fleischgewicht eines Hamburger? und der geleisteten Vorarbeit, lässt sich folgende Hypothese ableiten: H0: Das Hamburgerfleischgewicht beträgt im Mittel = 36 g. H1: Das Hamburgerfleischgewicht beträgt im Mittel # 36 g. Oder kürzer formuliert: H0: = 36 g H1: # 36 g H0 bezieht sich mit dem Mittelwert = 36 g auf die Grundgesamtheit und H1 mit dem Mittelwert # 36 g auf die Stichprobe. Wenn das Stichprobenergebnis stark von dem angenommenen Nullhypothesen-Wert abweicht und einen bestimmten kritischen Wert überschreitet, wird angenommen, dass die Aussage über die Grundgesamtheit (H0) nicht stimmt.
Diese Hervorhebung ist wichtig, da wir mit unserer Fragestellung auf das Verhalten der Grundgesamtheit eingehen. Die Basis dazu ist eine mehr oder weniger große repräsentative zufällig erzeugt Stichprobe. Von dieser Stichprobe schließen wir auf die Grundgesamtheit. E() = Mit dieser Annahme kann folgende Stichprobenverteilung konstruiert werden (Abb. 1): Abb.1 lässt aufgrund der Normalverteilungsannahme erwarten, dass Werte (das Hamburgerfleischgewicht als Messergebnis) nahe dem Erwartungswert E eine hohe Auftrittswahrscheinlichkeit und Werte weit weg von E eine kleine Auftrittswahrscheinlichkeit haben. Die Darlegung des Themas ist noch ein wenig theoretisch, später folgt im Text ein praktisches Beispiel. Aber nun geht es erst einmal theoretisch weiter. Wenn ein Messwert (Messwerte, Mittelwert) stark vom Erwartungswert E abweicht und dabei einen kritischen Wert überschreitet, nehmen wir an, dass unsere Nullhypothese H0 nicht korrekt ist und lehnen sie zugunsten der Alternativhypothese H1 ab. Der kritische Wert mit der dazugehörigen Fläche wird in Abb. 2 beispielhaft dargestellt: Der Hypothese folgend, zeigt Abb.2 zwei Ablehnungsbereiche. Das Hamburgerfleischgewicht kann schließlich nach unten und nach oben von dem erwarteten Mittelwert E() = 36 g abweichen. In diesem Fall, wird von einer ungerichteten Hypothese und einem zweiseitigen Test gesprochen. Die Fläche in der Stichprobenverteilung Abb. 2 ist der Ablehnungsbereich und entspricht der Wahrscheinlichkeit einen Wert zu finden, der größer ist als der kritische Wert. Mit der Fläche haben wir das Signifikanzniveau festgelegt. Um es deutlich hervorzuheben was in Abb. 2 grafisch beschrieben ist, wird die Nullhypothese H0 zugunsten der Alternativhypothese H1 abgelehnt, wenn der Mittelwert unserer Hamburgerfleischgewichts-Erhebung in dem rot schraffierten Ablehnungsbereich (Signifikanzniveaus /2) in Abb. 2 liegt. Gehen wir davon aus, dass ein Signifikanzniveaus = 0,1 gewählt wurde und der Mittelwert der Gewichtserhebung bei = 29 g Fleischgewicht liegt. Damit liegt er in dem unteren Ablehnungsbereich mit /2 = 0,1 / 2 = 0,05 und H0 wird zugunsten verworfen (Abb. 3). Das Testergebnis ist statistisch signifikant. Andersrum, wenn das Messergebnis Mittelwert im Annahmebereich 1- liegt, kann die Nullhypothese H0 nicht abgelehnt werden. Hierbei handelt es sich nur um Wahrscheinlichkeiten und es können Fehler bei der Annahme oder Ablehnung der Nullhypothese auftreten. Dieser Fehler entspricht dem gewählten Signifikanzniveau und es wird von einem Fehler 1. Art bzw. 2. Art gesprochen (Tabelle 1):
Haben wir aufgrund des Testergebnisses H0 abgelehnt obwohl H0 wahr ist, liegt ein Fehler 1. Art vor. H0 wurde fälschlicherweise verworfen. Wird H0 nicht abgelehnt und sie ist wahr, wurde die richtige
Entscheidung getroffen. Sie sollten nun eine wichtige Erkenntnis erlangt haben: Das Testergebnis ist nur ein Hinweis auf das Verhalten der Grundgesamtheit, aber kein echter Beweis! Anwendung des Hypothesentests Wir haben die Hypothese H0: = 36 g als Nullhypothese und H1: # 36 g als Alternativhypothese formuliert. Das Signifikanzniveau zu dem wir die Nullhypothese H0 ablehnen, legen wir auf 5 % fest: = 5% bzw. = 0,05 Um H0 zu testen, müssen Daten erhoben werden. D. h., wir müssen das Gewicht der Hamburgerfleischscheiben, auch Patty genannt, durch Wiegen ermitteln. Dazu wird die Stichprobengröße n auf n = 10 Patty’s festgelegt. Nun wird aus praktischen Gründen eine wichtige Annahme gemacht:
Beispiel Annahme der Nullhypothese H0: In Tabelle 2 sind die ermittelten Patty-Gewichte aufgeführt (Datei Patty_36.csv):
Die Prüfung unserer Hypothese führen wir mit dem parametrischen (weil wir eine Annahme bezüglich der Verteilung gemacht haben) Hypothesentest t.test() aus der Statistikumgebung R durch. Da die Stichprobe mit n = 10 deutlich kleiner als n = 30 ist, kommt hier die t-Verteilung zum Zuge, weil
Der t-Testwert wird wie folgt geschätzt (Abbildung 4): Ist der t-Testwert < als der t-Wert der t-Verteilung zum festgelegten Signifikanzniveaus und dem Freiheitsgrad f = n - 1, dann kann die Nullhypothese H0 beibehalten werden (Abbildung 5, siehe auch Sollwert-t-Test): Führen wir den t-Test endlich mit R durch. Die Patty-Gewichte aus Tabelle 2 sind im Datenobjekt Patty_36g gespeichert und das Hamburgerfleischgewicht der Nullhypothese H0 wird als Argument mu = 36 der Funktion t.test übergeben: > t.test(Patty_36g, mu = 36) Wie wird die Ausgabe (blau) der R-Funktion t.test interpretiert? Die Nullhypothese H0 kann nicht abgelehnt werden, weil
Mit diesen t- und p-Werten liegt der Mittelwert der Messreihe Patty_36g sehr gut im 1- der Abbildung 2. Zusätzlich wird der Vertrauensbereich (confidence interval) und der geschätzte Mittelwert der Stichprobe mit mean of x 36.09 ausgegeben. Beispiel Rückweisung der Nullhypothese H0: Um das Thema abzurunden, folgt nun ein Beispiel, bei dem die Nullhypothese H0 abgelehnt werden muss. In Tabelle 3 sind Patty-Gewichte einer weiteren Stichprobenerhebung aufgeführt (Datei Patty_29.csv):
Die Patty-Gewichte aus Tabelle 3 sind im Datenobjekt Patty_29g gespeichert und das Hamburgerfleischgewicht der Nullhypothese H0 wird als Argument mu = 36 der Funktion t.test übergeben: > t.test(Patty_29g, mu = 36) Aufgrund des t-Wertes t = -26.921 und des p-Wertes mit p-value = 6.518e-10 muss die Nullhypothese H0 zugunsten der Alternativhypothese H1 abgelehnt werden. Zur Veranschaulichung dient hierzu Abb. 3. Ich freue mich, wenn durch diesen Beitrag das Thema Hypothese und Signifikanz ein wenig klarer geworden ist und Sie dadurch sicherer in der Anwendung und Interpretation sind! |
Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen? |