Varianzanalyse

Zurück...

Varianzanalyse

Über die Varianzanalyse (ANOVA, Analysis of Variance) wird der Einfluss eines oder mehrerer unabhängiger Merkmale (deren Ausprägung) auf ein bzw. mehrere abhängiger Merkmale geprüft. Es wird von einem Zusammenhang zwischen den Merkmalen ausgegangen. Also zählt diese Analysemethode zu den strukturprüfenden Verfahren.
Ebenso ist die Varianzanalyse das bedeutendste Verfahren der Versuchsplanung.

Z. B kann über die Varianzanalyse der Einfluss verschiedener Einsatzstoffe auf die Ausbeute eines zu produzierenden Stoffes in der chemischen Industrie geprüft werden. Oder der Einfluss verschiedener Marketingstrategien auf den Absatz eines bestimmten Produktes.
An diesen Beispielen können Sie sicher schon erkennen, dass das Skalenniveau der unabhängigen Merkmalausprägung lediglich nominalskaliert sein braucht, hingegen das Skalenniveau der abhängigen Merkmalausprägung metrisch sein muss.

Hinweis: Die methodische Einführung in die Varianzanalyse zeigt auch das YouTube-Video “Varianzanalyse mit R”.

Der Typ der Varianzanalyse unterscheidet sich durch die Zahl der Faktoren. Wird die Wirkung eines unabhängigen Merkmals auf ein abhängiges Merkmal geprüft, wird von einer einfaktoriellen Varianzanalyse gesprochen. Dabei wird für das unabhängige Merkmal von einem Faktor und für die Merkmalausprägung von einer Faktorenstufe gesprochen.

Die folgenden Abbildungen zeigen beispielhaft unterschiedliche Typen der Varianzanalyse mit Wirkung auf ein abhängiges Merkmal:

Abb.1: Einfaktorielle Varianzanalyse

Abb. 2: Zweifaktorielle Varianzanalyse

Abb. 3: Dreifaktorielle Varianzanalyse

Liegt mehr als eine unabhängige Variable vor, wird von einer mehrdimensionalen Varianzanalyse gesprochen:

Abb. 4: Mehrdimensionale Varianzanalyse

Zunächst wird die Varianzanalyse über die einfaktorielle Varianzanalyse an folgenden einfachem Beispiel dargelegt. Später folgt dann als Beispiel die zweifaktorielle Varianzanalyse.

Beispiel einfaktorielle Varianzanalyse

In diesem Beispiel gehen wir von einer chemischen Wirkstoffproduktion aus. Der Wirkstoff stellt ein Isomerengemisch aus 2. Isomere dar (Isomere: Chemische Verbindungen, die bei gleicher Summenformel verschiedene Strukturen und somit verschiedene chemische und physikalische Eigenschaften aufweisen.). Das Isomer I soll die aktive Komponente sein, d. h., auf dessen Gehalt (Merkmal) kommt es unserem “Kunden” an.
Die Wirkstoffproduktion läuft über 3 Produktionsstrassen, die völlig (idealisierte Annahme) identisch sind. Nun soll durch geeignete Katalysatoren die Isomerenverteilung zum Isomer I verschoben werden.
Über die 3 Produktionsstraßen wurden jeweils 5 Chargen (5 Beobachtungen pro Faktorenstufe) unter dem Einsatz von für jede Produktionsstraße unterschiedlichen Katalysatoren gefertigt (Abb. 5):


	Abb. 5: Beispieldatensatz einfaktorielle Varianzanalyse

Im obigen Beispiel ist der Katalysator das unabhängige Merkmal mit den Katalysatoren A bis C als Merkmalausprägung und das Isomer I ist das abhängige Merkmal mit der Merkmalsausprägung %-Gehalt.
Wie der Mittelwert (Abb. 5, Spalte H) des Isomer-I-Gehaltes andeutet, scheint ein Unterschied zwischen den Katalysatoren zu bestehen.

Bevor mit dem Text fortgefahren werden kann, muss zum Verständnis der folgenden Berechnungen etwas zur Notation der Daten in obiger Tabelle (Abb. 5) gesagt werden:

x_(i,j) steht für die Merkmalausprägung des abhängigen Merkmals, auch wenn hier üblicherweise y verwendet wird! Der Index i steht für die Produktionsstraße oder Katalysator und der Index j für die Charge (Beobachtungen innerhalb i). Also beträgt die Ausprägung von x_(2,1) = 65 %.
_isteht für den Mittelwert der i-Produktionsstraße (Faktorenstufe), z. B.₂ = 64 % und
g steht für den Gesamtmittel, hier 52,6 %.

Es sei noch einmal erwähnt, dass im Folgenden angenommen wird, dass keine äußeren Einflüsse für die Isomerenverteilung der Produktionsstraßen (Katalysatoren) verantwortlich sind, d. h., die Produktionsstrassen werden als gleich angesehen.
Denn dann kann angenommen werden, dass ein möglicherweise vorliegender Mittelwertunterschied _i im Isomerengehalt für die 3 Produktionsstraßen auf Katalysatoreinflüsse (systematischer Einfluss) zurückzuführen ist.
Es muss also ermittelt werden, ob eine bestimmte Merkmalausprägung x_(i,j), z. B.der Wert x_(2,1) = 65 %, sich nur zufällig oder durch systematische Einflüsse (Katalysator) von dem Gesamtmittelwert _g, hier 52,6 %, unterscheidet.
Wir gehen von der Hypothese aus, dass die Abweichungen vom Gesamtmittelwert _g nicht zufällig sind. Die zufällige Abweichung wird in den 3 Fällen (3 Katalysatoren / Produktionsstraßen) als gleich angenommen (Streuungszerlegung):


	Gesamtabweichung = erklärte Abweichung + nicht erklärte Abweichung oder Gesamtabweichung = Abeichung Katalysator + zufällige Abweichung



		Abb. 6: Darstellung Streuungszerlegung


	Dieser Ansatz der Gesamtabweichung (Streuungszerlegung) wird zur Ermittlung der Abweichungsquadrate (siehe auch Schwerpunkteigenschaft) nach folgenden Formeln genutzt:

Gesamtabweichung	=	erklärte Abweichung	+	nicht erklärte (zufällige) Abweichung
..................................................................................................................................................................................
Summe der quadratischen Gesamtabweichung (SS = sum of squares)	=	Summe der quadratischen Abweichungen zwischen (between) den Faktorenstufen	+	Summe der quadratischen Abweichungen innerhalb (within) der Faktorenstufen
..................................................................................................................................................................................
SS_t(otal)	=	SS_b(etween)	+	SS_w(ithin)
..................................................................................................................................................................................
	=		+
F1		F2		F3


	Folgende Tabelle (Abb. 7) zeigt die Abweichungsquadrate für unser Beispiel aus Abb. 5:


	Abb. 7: Abweichungsquadrate für Beispiel einfaktorielle Varianzanalyse

Die Quadratsumme der Abweichungen stellt ein Maß für die Streuung dar. Es ist ersichtlich, dass die Größe der Quadratsumme von der Anzahl der Beobachtungen abhängig ist. Um die Streuung unabhängig von der Anzahl Beobachtungen (Werte) zu machen, wird sie durch die Anzahl Beobachtungen -1 ( n-1, Freiheitsgrad) dividiert. Damit erhalten wir die mittlere quadratische Abweichung (mean sum of squares, Varianz s):


	F4

Bevor die Varianzen berechnet werden können, müssen die Freiheitsgrade df für die summierte Abweichungsquadrate ermittelt werden.
Der Freiheitsgrad für die Summe der quadratischen Gesamtabweichung SS_t, da hier alle Beobachtungen (n) einfließen, ist einfach zu ermitteln: df SS_t= n - 1 = 15 - 1 = 14.
Der Freiheitsgrad für die Summe der quadratischen Abweichung zwischen den Faktorenstufen SS_b wird ermittelt, indem in n-1 n gegen i (Anzahl Faktorenstufen / Katalysator / Produktionsstraßen) ausgetauscht wird: df SS_b = i - 1 = 3 - 1 = 2.
Und schließlich wird der Freiheitsgrad für die Summe der quadratischen Abweichungen innerhalb der Faktorenstufe SS_w ermittelt, indem in n-1 n gegen j (Anzahl Beobachtungen innerhalb i) ausgetauscht wird: df SS_w = i(j - 1) = 3(5 - 1) = 12.
Zur besseren Übersicht, werden die SS- und df-Berechnungen gemeinsam dargestellt. Um die df-Berechnung nachvollziehen zu können, schauen Sie sich die Berechnung im Hinblick auf die Indizes i und j und dem jeweiligen Mittelwert an:

SS_t(otal)	=	SS_b(etween)	+	SS_w(ithin)
	=		+
df SS_t= n - 1 = 15 - 1 = 14		df SS_b = i - 1 = 3 - 1 = 2		df SS_w = i(j - 1) = 3(5 - 1) = 12
F5		F6		F7
Nun sind wir in der Lage auf Basis obiger Freiheitsgerade (F5 bis F6), die Varianzen (F8 bis F10) der Abweichungen zu berechnen (Abb. 8):

F8		F9		F10


	Abb. 8: Varianzen der Abweichungen


	Ausgehend von der Streuungszerlegung nehmen wir an, dass SS_b durch die unabhängige Variable und SS_w durch nicht erfasste, zufällige Einflussgrößen bestimmt wird. Das bedeutet für unser Beispiel, da Sss_b deutlich größer als Sss_w, der Katalysator einen erheblichen Einfluss auf das Isomerenverhältnis hat.


	Abb. 9

Oder allgemein formuliert, je größer die Varianz Sss_b im Vergleich zur Varianz Sss_w ist, desto eher ist ein Einfluss der unabhängigen Variablen anzunehmen.

Die Wirkung der unabhängigen Variablen auf die abhängige Variable wurde schon grafisch in Abbildung 6 dargestellt. Formalisiert entspricht dies für die einfaktorielle Varaianzanalyse folgendem Modell:

x_(i,j) = _g + a_i + e_(i,j)F5

x(i,j): Ausprägung des abhängigen Merkmals
_g: Gesamtmittelwert
a_i: Wirkung der Faktorenstufe, die sich durch die
Abweichung (_g - _i) ausdrückt
e_(i,j): zufälliger Einfluss der Größe x_(i,j)

Ob nun ein statistisch gesicherter Unterschied zwischen den Varianzen (Abb. 9) besteht oder nicht, wird mit dem F-Test geprüft.
Dazu wird Sss_b und Sss_w zur Prüfgrößenberechnung PG (empirischer F-Wert) wie folgt in Beziehung gesetzt:




	F11


	PG: Prüfgröße der F-Verteilung Sss_b: Varianz erklärte Abweichung Sss_w: Varianz zufällige Abweichung

Die Prüfgröße PG wird mit dem F-Wert der theoretischen F-Verteilung verglichen.

Für unser Beispiel beträgt die Prüfgröße PG...




	F12, berechnete PG

... und unsere Nullhypothese H₀ lautet, dass kein Unterschied zwischen den verschiedenen Katalysatoren (Faktorenstufen, Produktionsstrassen) besteht:

H₀ = a₁ = a₂ = a₃ = 0

Die Alternativhypothese H₁ lautet dann hingegen, dass ein Unterschied zwischen den Katalysatoren besteht:

H₁ = min. ein a-Wert <> 0

Wenn Sie zur Verdeutlichung noch einmal auf die Spalte Sss_b der Abbildung 7 schauen, werden Sie sicher erwarten, dass die Alternativhypothese H₁ zutrifft.
Der F-Wert der F-Verteilung hängt von der Anzahl der Freiheitsgrade ab. Der df Sss_b beträgt 2 (siehe F6), df Sss_w beträgt 12 (siehe F12). Die Ermittlung des F-Wertes für P = 97,5% auf Basis der F-Tabelle wird in Abbildung 9 gezeigt:




	Abb. 9: Ermittlung des F-Wertes

f₁, Freiheitsgrad Zähler, entspricht dem Freiheitsgrad df Sss_b und f₂, Freiheitsgrad Nenner, dem Freiheitsgrad Sss_w. Der Wert der F-Verteilung entspricht somit:

F-Wert_{(2,12,P=97,5%)} = 5,1


	Die Prüfgröße PG wird mit dem F-Wert verglichen. Ist die PG größer als der F-Wert, wird die Nullhypothese H₀ verworfen, d. h., mit der entsprechenden Wahrscheinlichkeit muss davon ausgegangen werden, dass ein Einfluss des unabhängigen Merkmals vorliegt:


	H₀ trifft nicht zu, wenn PG > F-Wert

Für unser Beispiel trifft H₀ nicht zu, weil

PG > F-Wert_{(2,12,P=97,5%)}

179,37 > 5,1

Die Alternativhypothese H₁ muss aufgrund des obigen Vergleichs angenommen werden. Somit liegt mit einer Wahrscheinlichkeit von 97,5% ein Wirkeinfluss der Katalysatoren vor.

Beispiel zweifaktorielle Varianzanalyse

Die Erweiterung der einfaktoriellen Varianzanalyse auf die zweifaktorielle Varianzanalyse, d. h. die Untersuchung des Einflusses von zwei unabhängigen Merkmalen auf ein abhängiges Merkmal (Abb. 2), wird auch Faktorielles Design genannt. Dabei wird auf das Prinzip der einfaktoriellen Varianzanalyse aufgebaut.
Aufbauend auf unser Katalysatorbeispiel vermuten wir einen zusätzlichen Einfluss des pH-Wertes, ob also das Reaktionsmedium sauer (z. B. pH 3) oder basisch (z. B. pH 9) ist, auf das Isomerenverhältnis.
Der pH-Wert ist ein Maßzahl der Wasserstoffionenkonzentration (H⁺-Ionen) im Medium. Wie sauer oder basisch (alkalisch) ist das Medium?

Die einfaktorielle wird dadurch auf die zweifaktorielle Varianzanalyse erweitert.

Durch 3 Katalysator- und 2 pH-Wert-Varianten ergeben sich 3 * 2 Kombinationen der Faktorenstufen (Katalysator * pH-Wert) und diese 3x2-Matrix führt zur gebräuchlichen Bezeichnung 3x2-faktorielles Design. Die Stichprobenzahl (Zahl der Experimente) erhöht sich dadurch notwendigerweise auf 3 * 2= 6.

Abb. 10 zeigt den Beispieldatensatz zur zweifaktoriellen Varianzanalyse.
Bei den Werten in den Zellen/Spalten handelt es sich weiterhin um den %-Anteil des Isomer-I als Ausprägung des abhängigen Merkmals (Faktorenstufe) aus unserem Beispiel.

Bei mehr als einem unabhängigen Merkmal könnten zwischen den Merkmalen Abhängigkeiten (Wechselwirkungen / Interaktionen) bestehen. Siehe hierzu auch die Seiten zum Thema Faktorenanalyse.




	Abb. 10: Beispieldatensatz zweifaktorielle Varianzanalyse

Eine einfache Prüfung auf Wechselwirkungen zwischen den Merkmalen (Faktoren) kann über eine grafische Darstellung der Faktorenstufenmittelwerte (Isomer I) erfolgen.

Abb. 11 zeigt die Faktorenstufenmittelwerte...




	Abb. 11: Faktorenstufenmittelwert


	... und Abb. 12 zeigt die grafische Darstellung:




		Abb. 12: Grafische Prüfung auf Wechselwirkung

Es liegt keine Wechselwirkung vor, wenn die Verbindungslinien zwischen den Merkmalmittelwerten aus Abb. 10 oder Abb. 11 wie in Abb. 12 gezeigt, nahezu parallel verlaufen. Hier ist natürlich Ihre Interpretationsfähigkeit verlangt. Denn zwischen nahezu und nicht parallel müssen Sie interpretieren, da ein nichtparalleler Verlauf auf eine Wechselwirkung zwischen den Merkmalen (Faktoren) hinweist.
Die Streuungszerlegung aus dem Beispiel einfaktorielle Varianzanalyse wird nun um das 2. unabhängige Merkmal erweitert werden. Dazu wird im Folgenden der Faktor Katalysator mit K und der Faktor pH-Wert mit p bezeichnet. Abbildung 13 zeigt eine Übersicht über die Streuungszerlegung:




	Abb. 13: Übersicht Streuungszerlegung

Aus der vereinfachten Darstellung SS_t = SS_b + SS_w (hellblaue Kästchen) wird

SS_t = SS_K + SS_p + SS_K*p + SS_w F13

in der SS_b durch die Streuungen des Faktors K (SS_K), des Faktors p (SS_p)und der Wechselwirkung zwischen den Faktoren K und p (SS_K*p) ersetzt wurde (F13).
Darauf basierend, kann das Wirkmodell der einfaktoriellen Varianzanalyse (F5) auf das Wirkmodell der zweifaktoriellen Varianzanalyse (F14) mit Wechselwirkung erweitert werden:

x_(i,j,k) = _g + K_i + p_j + (Kp)_ij + e_(i,j,k) F14

x_(i,j,k): Ausprägung des unabhängigen Merkmals
_g:    Gesamtmittelwert
K_i:       Wirkung des Faktors Katalysator
p_j:        Wirkung des Faktors pH-Wert
(Kp)_ij: Wechselwirkung zwischen den Faktoren
e_(i,j,k): zufälliger Einfluss der Größe x_(i,j,k) (nicht
             kontrollierbare Einflüsse)

Zur übersichtlichen Berechnung der Abweichungsquadrate wird die Tabelle aus Abb. 10 um die nötigen Summenstufen und um die Berechung der Zeilenmittelwerte _(i)und Spaltenmittelwerte _(j) erweitert (Abb. 14):


	Abb. 14: Bespieldatensatz erweitert um die Summenstufen

Im Vergleich zur einfaktoriellen Varianzanalyse sieht obige Tabelle (Abb. 14) komplexer aus. Zum erleichterten Verständnis dient die Abb. 15, die die verwendeten Indizes übersichtlich darstellt.
Der Index i steht für die Katalysatoren, der Index j für die pH-Werte und der Index k für die jeweilige Ausprägung der Faktorenstufe in Abhängigkeit Katalysator/pH-Wert.

In der Differenz der Spaltenmittelwerte _(j) macht sich der Einfluss des Faktors “pH -Wert” und in den Differenzen der Zeilenmittelwerte _(i) der Einfluss des Faktors “Katalysator” bemerkbar.




	Abb. 15: Indizes zur Abb. 14

In den Differenzen der Mittelwerte der Ausprägungen in Abhängigkeit der Faktoren Katalysator/pH-Wert (z. B. 41,6 oder 39,8) macht sich der gemeinsame Einfluss von Katalysator und pH-Wert bemerkbar.
Oder in anderen Worten (was ja im einleitenden Satz zum Thema als vorausgehende Vermutung zur Anwendung der ANOVA gesagt wurde): Jede Ausprägung der unabhängigen Variablen (Faktoren) Katalysator und pH-Wert hat einen Einfluss auf die abhängige Variable (Faktorenstufe) Isomerenverteilung. Bevor die vermutete Beeinflussung der Isomerenverteilung geprüft werden kann, müssen die nötigen SS-Parameter berechnet (geschätzt) werden. Der Einfuss der unabhängigen Merkmale, inklusive der Wechselwirkung zwischen den Faktoren und der zufälligen Streuung, wird durch Formel F14 beschrieben. Die Paramter von F14, bis auf den Anteil der zufälligen Streuung, wird wie folgt geschätzt (siehe auch Abb. 14):

_g:   Gesamtmittelwert
K_i:      (_i - _g)              (g: gesamt)
p_j:       (_j - _g)
Kp_ij:   _ij - _i - _j + _g = _ij -x*_ij
x*_ij = _i + _j - _g

Analog der einfaktoriellen Varianzanalyse wird der Einfluss der Faktoren auf die Gesamtstreuung SS_t geprüft (siehe F13).
Die Gesamtstreuung SS_t wird wie folgt berechnet ...


	F15


	.... und beträgt SS_t = 2541,37 . Die Hauptbeeinflussung (Haupteffekte, main effects) erfolgt (... sollte erfolgen ...) durch die Faktoren K(atalysator) und p(H-Wert) und werden, wie schon angedeutet, über die Abweichung der Zeilen- bzw. Spaltenmittelwerte (_(i), _(j)) vom Gesamtmittelwert _g berechnet:


	F16

	F17


	ni: Anzahl der Ausprägungen des Faktors “Katalysator” nj: Anzahl der Ausprägungen des Faktors “pH-Wert” nk: Anzahl der Beobachtungen pro ni und nj _i: Zeilenmittelwert _j: Spaltenmittelwert _g: Gesamtmittelwert

Und für unser Beispiel auf Basis von Abbildung 14 beträgt

SS_K = 2*5[(40,7-51,57)²+(62,8-51,57)²+(51,2-51,57)²] = 2444,07

und

SSp = 3*5[(52,6-51,57)²+(50,53-51,57)²] = 32,14

Die Wechselwirkung zwischen den Faktoren “Katalysator” und “pH-Wert” wird wie folgt geschätzt:


	F18


	siehe F16/F17 x*_ij: _i + _j - _g

Der Schätzwert x*_ij ist der Mittelwert der als Mittelwert für jede Kombination Katalysator (i) / pH-Wert (j) (siehe Abb. 14) zu erwarten wäre, wenn keine Wechselwirkung vorliegt. Der Schätzwert x*_ij muss zur SS_K*p-Berechnung zuvor ermittelt werden:

x*_ij = _i + _j - _g

x*₁₁ = 40,7 + 52,6 - 51,57 = 41,73
x*₁₂ = 40,7 + 50,53 - 51,57 = 39,66
x*₂₁ = 62,8 + 52,6 - 51,57 = 63,83
x*₂₂ = 62,8 + 50,53 - 51,57 = 61,76
x*₃₁ = 51,2 + 52,6 - 51,57 = 52,23
x*₃₂ = 51,2 + 50,53 - 51,57 = 50,16

Die Abweichung zwischen beobachtetem Mittelwert (siehe Abb. 14) z.B. für Katalysator A und pH-Wert “sauer” ₁₁ = 41,6 und dem Schätzwert x*₁₁ = 41,73 ist ein Maß für den Wechselwirkungseffekt. Nun kann die SS_K*p-Berechnung durchgeführt werden:

SS_K*p = 5[(41,6-41,73)²+(39,8-39,66)²+(64-63,83)²+(61,6-61,76)²+(52,2-52,23)² +(50,2-51,16)²] = 0,47

Jetzt sind wir in der Lage, den SS_b-Wert zu berechnen. Wir wissen, dass der SS_b-Wert zusammen gesetzt wird aus der Streuung des Faktors K (SS_K), des Faktors p (SS_p) und der Wechselwirkung der Faktoren K und p (SS_K*p). Somit lässt sich SS_b berechnen:

SS_b = SS_K + SS_p + SS_K*pF19, siehe auch F13

SS_b = 2444,07 + 32,14 + 0,47 = 2476,68

Als letzter Schritt der Berechnung der summierten Abweichungsquadrate wird die “nicht erklärte”, die zufällige Streuung SS_w geschätzt.


	F20


	Hier bemühen wir wieder das Tabellenkalkulationsprogramm, um die Berechnung auf Basis von F20 übersichtlicher zu gestalten (Abb. 16):


	Abb. 16, Berechnung von SS_w

Der SS_w-Wert beträgt 64,8. Die obige Schätzung nach F20 wäre nicht nötig zur Ermittlung des SS_w-Wertes gewesen, da mit SS_t und SS_b auf Basis von F13 bzw. der Streuungszerlegung SS_w die Differenz as SS_t und SS_b ist. Die Berechnung über diesen Weg sollten Sie aus Kontrollgründen durchführen, nur denken Sie an mögliche Rechenungenauigkeiten.

Tragen wir die Werte der Streuung zusammen:

SS_t = SS_b + SS_w2541,37 = 2476,68 + 64,8

Oder SS_b aufgelöst:

SS_t = SS_K + SS_p + SS_K*p + SS_w2541,37 = 2444,07 + 32,14 + 0,47 + 64,8

In der nach SS_b aufgelösten Form, ist natürlich mehr Information enthalten. Sie können den Anteil der Hauptbeeinflussungen durch die Faktoren, hier SS_K und SS_p, abschätzen. Dadurch können Sie erkennen, dass der Einfluss von SS_p (32,14) im Vergleich zu SS_K (2444,07) sehr gering ist. Hinzu kommt der bedenkliche Vergleich zwischen SS_p und SS_w (64,8).

Kommen wir zur statistischen Prüfung auf unterschiedlichen Einfluss der beiden Faktoren. Die Berechnung der SS-Werte erfolgt über die Mittelwerte und darauf formulieren wir unser Hypothesen. Sind alle Mittelwerte gleich, kann angenommen werden, dass keine Beeinflussung der jeweiligen Faktorenstufe (Ausbeute Isomer I) vorliegt (Nullhypothese H₀). Die Alternativhypothese H₁ liegt dann vor, wenn mindestens ein Faktor Auswirkungen auf die Faktorstufe zeigt.
Ebenso werden die Hypothesen bezüglich der Wechselwirkung zwischen den Faktoren formuliert: Hier lautet die Nullhypothese H₀, es gibt keine Wechselwirkung - auf Basis der Mittelwerte - zwischen den Faktoren, oder als Alternativhypothese H₁ das eine Wechselwirkung vorliegt.
Zur Berechnung der Prüfgröße PG wird der Freiheitsgraden df benötigt. Die Ermittlung der Freiheitsgrade wird hier übersichtlich dargestellt:

df SS_K = i - 1 = 3 - 1 = 2
df SS_p = j - 1 = 2 -1 = 1
df SS_K*p = ( i - 1)(j - 1) = 2 * 1 = 2
df SS_w = i * j * (k - 1) = 3 * 2 * (5 - 1) = 24
df SS_t = i * j * k -1 = 3 * 2 * 5 - 1 = 29

Aus den SS-Werten und den zugehörigen Freiheitsgraden wird die Varianz berechnet (Abb. 17):

Varianzherkunft:	SS-Wert:	df:	Varianz:
Haupteinfluss Katalysator (K) pH-Wert (p)	2444,07 32,14	2 1	1222,04 32,14
Wechselwirkung Katalysator/pH-Wert (K*p)	0,47	2	0,24
Nicht erklärte (zufällige) Streuung (w)	64,8	24	2,7
Gesamtabweichung (t)	2541,37	29	87,63


	Abb. 17: Tabelle der Varianzen


	Die Prüfgröße PG wird durch Division der Varianzen mit der Varianz der “Nicht erklärten Streuung (w)” (gelbe Zeile, siehe F12) berechnet und neben den tabellarischen F-Werten und Hypothesen tabellarisch dargestellt (Abb.18):

Varianzherkunft:	PG:	F-Wert _(P=97,5%)	df_Zähler	df_Nenner	Hypothese?
Haupteinfluss Katalysator (K) pH-Wert (p)	452,6 11,9	4,32 5,72	2 1	24 24	PG>F, H₀ wird verworfen PG>F, H₀ wird verworfen
Wechselwirkung Katalysator/ pH-Wert (K*p)	0,09	4,32	2	24	PG<F, H₀ trifft zu


	Abb. 18: Prüfung der Hypothesen

Mit einer Wahrscheinlichkeit P=97,5% zeigen die Faktoren Katalysator und pH-Wert einen Einfluss auf die Faktorenstufe (abhängiges Merkmal). Ebenso liegt mit einer Wahrscheinlichkeit P=97,5% keine Wechselwirkung zwischen den Faktoren Katalysator und pH-Wert vor.

Bemerkungen zur Varianzanalyse

Die Varianzanalyse ist ein strukturprüfendes Verfahren. Das bedeutet, dass die Frage, die durch die Varianzanalyse beantwortet werden soll, sich nicht erst aus den Daten ergeben darf. Von den Daten des unabhängigen sowie des abhängigen Merkmals und der Hypothese hängt die inhaltliche Relevanz der Aussage ab. Es wird keine Aussage über die Stärke des Zusammenhangs gemacht. Siehe hierzu auch Abb. 18.
Natürlich müssen sich die Faktoren unterscheiden, sonst lässt sich die Varianz bezüglich der abhängigen Variable nicht eindeutig auf die Faktoren zurückführen. Das hat auch zur Folge, dass die unabhängigen Variablen sich additiv (linearer Modellansatz) verhalten müssen. Dies ist eine der Voraussetzungen zur Varianzanalyse und wird mit dem Begriff Additivität der unabhängigen Variablen bezeichnet. Für die einfaktorielle Varianzanalyse bedeutet dies, dass auch die zufällige Streuung keinen Einfluss auf die unabhängige Variable ausübt.
Eine weitere Voraussetzung zur Varianzanalyse ist die Normalverteilung der Grundgesamtheit. Das bedeutet dann natürlich auch, dass die Stichprobe (die Beobachtungen) genügend groß ist und nicht durch systematische Effekte bezüglich der Grundgesamtheit nicht mehr repräsentativ ist.


	Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?

Impressum

Datenschutz