Zurück...

Varianzanalyse

Über die Varianzanalyse (ANOVA, Analysis of Varaince) wird der Einfluss eines oder mehrerer unabhängiger Merkmale (deren Ausprägung) auf ein bzw. mehrere abhängiger Merkmale geprüft. Es wird von einem Zusammenhang zwischen den Merkmalen ausgegangen. Also zählt diese Analysenmethode zu den strukturprüfenden Verfahren.
Ebenso ist die Varianzanalyse das bedeutendste Verfahren der Versuchsplanung.

Z. B kann über die Varianzanalyse der Einfluss verschiedener Einsatzstoffe auf die Ausbeute eines zu produzierenden Stoffes in der chemischen Industrie geprüft werden. Oder der Einfluss verschiedener Marketingstrategien auf den Absatz eines bestimmten Produktes.
An diesen Beispielen können Sie sicher schon erkennen, dass das Skalenniveau der unabhängigen Merkmalausprägung lediglich nominalskaliert sein braucht, hingegen das Skalenniveau der abhängigen Merkmalausprägung metrisch sein muss.

Der Typ der Varianzanalyse unterscheidet sich durch die Zahl der Faktoren. Wird die Wirkung eines unabhängigen Merkmals auf ein abhängiges Merkmal geprüft, wird von einer einfaktoriellen Varianzanalyse gesprochen. Dabei wird für das unabhängige Merkmal von einem Faktor und für die Merkmalausprägung von einer Faktorenstufe gesprochen.

Die folgenden Abbildungen zeigen beispielhaft unterschiedliche Typen der Varianzanalyse mit Wirkung auf ein abhängiges Merkmal:

Abb.1: Einfaktorielle Varianzanalyse

Abb. 2: Zweifaktorielle Varianzanalyse

Abb. 3: Dreifaktorielle Varianzanalyse

Liegt mehr als eine unabhängige Variable vor, wird von einer mehrdimensionalen Varianzanalyse gesprochen:

Abb. 4: Mehrdimensionale Varianzanalyse

Zunächst wird die Varianzanalyse über die einfaktorielle Varianzanalyse an folgenden einfachem Beispiel dargelegt. Später folgt dann als Beispiel die zweifaktorielle Varianzanalyse.

Beispiel einfaktorielle Varianzanalyse

In diesem Beispiel gehen wir von einer chemischen Wirkstoffproduktion aus. Der Wirkstoff stellt ein Iosomerengemisch aus 2. Isomere dar (Isomere: Chemische Verbindungen, die bei gleicher Summenformel verschiedene Strukturen und somit verschiedene chemische und physikalische Eigenschaften aufweisen.). Das Isomer I soll die aktive Komponente sein, d. h., auf dessen Gehalt (Merkmal) kommt es unserem “Kunden” an.
Die Wirkstoffproduktion läuft über 3 Produktionsstrassen, die völlig (idealisierte Annahme) identisch sind. Nun soll durch geeignete Katalysatoren die Isomerenverteilung zum Isomer I verschoben werden.
Über die 3 Produktionsstraßen wurden jeweils 5 Chargen (5 Beobachtungen pro Faktorenstufe) unter dem Einsatz von für jede Produktionsstraße unterschiedlichen Katalysatoren  gefertigt (Abb. 5):

Abb. 5: Beispieldatensatz einfaktorielle Varianzanalyse

Im obigen Beispiel ist der Katalysator das unabhängige Merkmal mit den Katalysatoren A bis C als Merkmalausprägung und das Isomer I ist das abhängige Merkmal mit der Merkmalsausprägung %-Gehalt.
Wie der Mittelwert (Abb. 5, Spalte H) des Isomer-I-Gehaltes andeutet, scheint ein Unterschied zwischen den Katalysatoren zu bestehen.

Bevor mit dem Text fortgefahren werden kann, muss zum Verständnis der folgenden Berechnungen etwas zur Notation der Daten in obiger Tabelle (Abb. 5) gesagt werden:

  • x(i,j) steht für die Merkmalausprägung des abhängigen Merkmals, auch wenn hier üblicherweise y verwendet wird! Der Index i steht für die Produktionsstraße oder Katalysator und der Index j für die Charge (Beobachtungen innerhalb i). Also beträgt die Ausprägung von x(2,1) = 65 %.
  • i steht für den Mittelwert der i-Produktionsstraße (Faktorenstufe), z. B. 2 = 64 % und
  • g steht für den Gesamtmittel, hier 52,6 %.

Es sei noch einmal erwähnt, dass im Folgenden angenommen wird, dass keine äußeren Einflüsse für die Isomerenverteilung der Produktionsstraßen (Katalysatoren) verantwortlich sind, d. h., die Produktionsstrassen werden als gleich angesehen.
Denn dann kann angenommen werden, dass ein möglicherweise vorliegender Mittelwertunterschied i im Isomerengehalt für die 3 Produktionsstraßen auf Katalysatoreinflüsse (systematischer Einfluss) zurückzuführen ist.
Es muss also ermittelt werden, ob eine bestimmte Merkmalausprägung x(i,j), z. B.der Wert x(2,1) = 65 %, sich nur zufällig oder durch systematische Einflüsse (Katalysator) von dem Gesamtmittelwert g, hier 52,6 %, unterscheidet.
Wir gehen von der Hypothese aus, dass die Abweichungen vom Gesamtmittelwert g nicht zufällig sind. Die zufällige Abweichung wird in den 3 Fällen (3 Katalysatoren / Produktionsstraßen) als gleich angenommen (Streuungszerlegung):

Gesamtabweichung = erklärte Abweichung + nicht erklärte Abweichung
oder
Gesamtabweichung = Abeichung Katalysator + zufällige Abweichung

Abb. 6: Darstellung Streuungszerlegung

Dieser Ansatz der Gesamtabweichung (Streuungszerlegung) wird  zur Ermittlung der Abweichungsquadrate (siehe auch Schwerpunkteigenschaft) nach folgenden Formeln genutzt:

Gesamtabweichung

=

erklärte Abweichung

+

nicht erklärte (zufällige) Abweichung

..................................................................................................................................................................................

Summe der quadratischen Gesamtabweichung
(SS = sum of squares)

=

Summe der quadratischen Abweichungen zwischen (between) den Faktorenstufen

+

Summe der quadratischen Abweichungen innerhalb (within) der Faktorenstufen

..................................................................................................................................................................................

SSt(otal)

=

SSb(etween)

+

SSw(ithin)

..................................................................................................................................................................................

=

+

F1

 

F2

 

F3

Folgende Tabelle (Abb. 7) zeigt die Abweichungsquadrate für unser Beispiel aus Abb. 5:

Abb. 7: Abweichungsquadrate für Beispiel einfaktorielle Varianzanalyse

Die Quadratsumme der Abweichungen stellt ein Maß für die Streuung dar. Es ist ersichtlich, dass die Größe der Quadratsumme von der Anzahl der Beobachtungen abhängig ist. Um die Streuung unabhängig von der Anzahl Beobachtungen (Werte) zu machen, wird sie durch die Anzahl Beobachtungen -1 ( n-1, Freiheitsgrad) dividiert. Damit erhalten wir die mittlere quadratische Abweichung (mean sum of squares, Varianz s):

Sprung zu Freiheitsgrad

F4

Bevor die Varianzen berechnet werden können, müssen die Freiheitsgrade df für die summierte Abweichungsquadrate ermittelt werden.
Der Freiheitsgrad für die Summe der quadratischen Gesamtabweichung SSt, da hier alle Beobachtungen (n) einfließen, ist einfach zu ermitteln: df SSt = n - 1 = 15 - 1 = 14.
Der Freiheitsgrad für die Summe der quadratischen Abweichung zwischen den Faktorenstufen SSb wird ermittelt, indem in n-1  n gegen i (Anzahl Faktorenstufen / Katalysator / Produktionsstraßen) ausgetauscht wird: df SSb = i - 1 = 3 - 1 = 2.
Und schließlich wird der Freiheitsgrad für die Summe der quadratischen Abweichungen innerhalb der Faktorenstufe SSw  ermittelt, indem in n-1 n gegen j (Anzahl Beobachtungen innerhalb i) ausgetauscht wird: df SSw =  i(j - 1) = 3(5 - 1) = 12.
Zur besseren Übersicht, werden die SS- und df-Berechnungen gemeinsam dargestellt. Um die df-Berechnung nachvollziehen zu können, schauen Sie sich die Berechnung im Hinblick auf die Indizes i und j und dem jeweiligen Mittelwert an:

SSt(otal)

=

SSb(etween)

+

SSw(ithin)

=

+

df SSt = n - 1 = 15 - 1 = 14

 

df SSb = i - 1 = 3 - 1 = 2

 

df SSw =  i(j - 1) = 3(5 - 1) = 12

F5

 

F6

 

F7

Nun sind wir in der Lage auf Basis obiger Freiheitsgerade (F5 bis F6), die Varianzen (F8 bis F10) der Abweichungen zu berechnen (Abb. 8):

 

 

F8

 

F9

 

F10

Abb. 8: Varianzen der Abweichungen

Ausgehend von der Streuungszerlegung nehmen wir an, dass SSb durch die unabhängige Variable und SSw durch nicht erfasste, zufällige Einflussgrößen bestimmt wird. Das bedeutet für unser Beispiel, da Sssb deutlich größer als Sssw, der Katalysator einen erheblichen Einfluss auf das Isomerenverhältnis hat.

Abb. 9

Oder allgemein formuliert, je größer  die Varianz Sssb im Vergleich zur Varianz Sssw ist, desto eher ist ein Einfluss der unabhängigen Variablen anzunehmen.

Die Wirkung der unabhängigen Variablen auf die abhängige Variable wurde schon grafisch in Abbildung 6 dargestellt. Formalisiert entspricht dies für die einfaktorielle Varaianzanalyse folgendem Modell:

              x(i,j) = g + ai + e(i,j)           F5

              x(i,j): Ausprägung des abhängigen Merkmals
              g: Gesamtmittelwert
              ai: Wirkung der Faktorenstufe, die sich durch die
                   Abweichung (g - i) ausdrückt
              e(i,j): zufälliger Einfluss der Größe x(i,j)


Ob nun ein statistisch gesicherter Unterschied zwischen den Varianzen (Abb. 9) besteht oder nicht, wird mit dem F-Test geprüft.
Dazu wird Sssb und Sssw zur Prüfgrößenberechnung PG (empirischer F-Wert) wie folgt in Beziehung gesetzt:

F11

PG: Prüfgröße der F-Verteilung
Sssb: Varianz erklärte Abweichung
Sssw: Varianz zufällige Abweichung

Die Prüfgröße PG wird mit dem F-Wert der theoretischen F-Verteilung verglichen.

Für unser Beispiel beträgt die Prüfgröße PG...

F12, berechnete PG

... und unsere Nullhypothese H0 lautet, dass kein Unterschied zwischen den verschiedenen Katalysatoren (Faktorenstufen, Produktionsstrassen) besteht:

H0 = a1 = a2 = a3 = 0

Die Alternativhypothese H1 lautet dann hingegen, dass ein Unterschied zwischen den Katalysatoren besteht:

H1 = min. ein a-Wert <> 0

Wenn Sie zur Verdeutlichung noch einmal auf die Spalte Sssb der Abbildung 7 schauen, werden Sie sicher erwarten, dass die Alternativhypothese H1 zutrifft.
Der F-Wert der F-Verteilung hängt von der Anzahl der Freiheitsgrade ab. Der df Sssb beträgt 2 (siehe F6), df Sssw beträgt 12 (siehe F12). Die Ermittlung des F-Wertes für P = 97,5% auf Basis der F-Tabelle wird in Abbildung 9 gezeigt:

Sprung zur F-Vertilungs-Tabelle

Abb. 9: Ermittlung des F-Wertes

f1, Freiheitsgrad Zähler, entspricht dem Freiheitsgrad df Sssb und f2, Freiheitsgrad Nenner, dem Freiheitsgrad Sssw. Der Wert der F-Verteilung entspricht somit:

F-Wert(2,12,P=97,5%) = 5,1

Die Prüfgröße PG wird mit dem F-Wert verglichen. Ist die PG größer als der F-Wert, wird die Nullhypothese H0 verworfen, d. h., mit der entsprechenden Wahrscheinlichkeit muss davon ausgegangen werden, dass ein Einfluss des unabhängigen Merkmals vorliegt:

H0 trifft nicht zu, wenn PG > F-Wert

Für unser Beispiel trifft H0 nicht zu, weil

PG > F-Wert(2,12,P=97,5%)

179,37 > 5,1

Die Alternativhypothese H1 muss aufgrund des obigen Vergleichs angenommen werden. Somit liegt mit einer Wahrscheinlichkeit von 97,5% ein Wirkeinfluss der Katalysatoren vor.
Das hier gezeigte Beispiel kann als OpenOffice Tabelle (*.ods) geladen werden.

Beispiel zweifaktorielle Varianzanalyse

Die Erweiterung der einfaktoriellen Varianzanalyse auf die zweifaktorielle Varianzanalyse, d. h. die Untersuchung des Einflusses von zwei unabhängigen Merkmalen auf ein abhängiges Merkmal (Abb. 2), wird auch Faktorielles Design genannt. Dabei wird auf das Prinzip der einfaktoriellen Varianzanalyse aufgebaut.
Aufbauend auf unser Katalysatorbeispiel vermuten wir einen zusätzlichen Einfluss des pH-Wertes, ob also das Reaktionsmedium sauer (z. B. pH 3) oder basisch (z. B. pH 9) ist, auf das Isomerenverhältnis.
Der pH-Wert ist ein Maßzahl der Wasserstoffionenkonzentration (H+-Ionen) im Medium. Wie sauer oder basisch (alkalisch) ist das Medium?

Die einfaktorielle wird dadurch auf die zweifaktorielle Varianzanalyse erweitert.

Durch 3 Katalysator- und 2 pH-Wert-Varianten ergeben sich 3 * 2 Kombinationen der Faktorenstufen (Katalysator * pH-Wert) und diese 3x2-Matrix führt zur gebräuchlichen Bezeichnung 3x2-faktorielles Design. Die Stichprobenzahl (Zahl der Experimente) erhöht sich dadurch notwendigerweise auf 3 * 2= 6.

Abb. 10 zeigt den Beispieldatensatz zur zweifaktoriellen Varianzanalyse.
Bei den Werten in den Zellen/Spalten handelt es sich weiterhin um den %-Anteil des Isomer-I als Ausprägung des abhängigen Merkmals (Faktorenstufe) aus unserem Beispiel.

Bei mehr als einem unabhängigen Merkmal könnten zwischen den Merkmalen Abhängigkeiten (Wechselwirkungen / Interaktionen) bestehen. Siehe hierzu auch die Seiten zum Thema Faktorenanalyse.

Abb. 10: Beispieldatensatz zweifaktorielle Varianzanalyse

Eine einfache Prüfung auf Wechselwirkungen zwischen den Merkmalen (Faktoren) kann über eine grafische Darstellung der Faktorenstufenmittelwerte (Isomer I) erfolgen.

Abb. 11 zeigt die Faktorenstufenmittelwerte...

Abb. 11: Faktorenstufenmittelwert

... und Abb. 12 zeigt die grafische Darstellung:

Abb. 12: Grafische Prüfung auf Wechselwirkung

Es liegt keine Wechselwirkung vor, wenn die Verbindungslinien zwischen den Merkmalmittelwerten aus Abb. 10 oder Abb. 11 wie in Abb. 12 gezeigt, nahezu parallel verlaufen. Hier ist natürlich Ihre Interpretationsfähigkeit verlangt. Denn zwischen nahezu und nicht parallel müssen Sie interpretieren, da ein nichtparalleler Verlauf auf eine Wechselwirkung zwischen den Merkmalen (Faktoren) hinweist.
Die Streuungszerlegung aus dem Beispiel einfaktorielle Varianzanalyse wird nun um das 2. unabhängige Merkmal erweitert werden. Dazu wird im Folgenden der Faktor Katalysator mit K und der Faktor pH-Wert mit p bezeichnet. Abbildung 13 zeigt eine Übersicht über die Streuungszerlegung:

Abb. 13: Übersicht Streuungszerlegung

Aus der vereinfachten Darstellung SSt = SSb + SSw (hellblaue Kästchen) wird

SSt = SSK + SSp + SSK*p + SSw    F13

in der SSb durch die Streuungen des Faktors K (SSK), des Faktors p (SSp)und der Wechselwirkung zwischen den Faktoren K und p (SSK*p) ersetzt wurde (F13).
Darauf basierend,  kann das Wirkmodell der einfaktoriellen Varianzanalyse (F5) auf das Wirkmodell der zweifaktoriellen Varianzanalyse (F14) mit Wechselwirkung erweitert werden:

x(i,j,k) = g + Ki + pj + (Kp)ij + e(i,j,k)    F14

              x(i,j,k): Ausprägung des unabhängigen Merkmals
              g:    Gesamtmittelwert
              Ki:       Wirkung des Faktors Katalysator
              pj:        Wirkung des Faktors pH-Wert
              (Kp)ij:  Wechselwirkung zwischen den Faktoren
              e(i,j,k):  zufälliger Einfluss der Größe x(i,j,k) (nicht
                           kontrollierbare Einflüsse)

Zur übersichtlichen Berechnung der Abweichungsquadrate wird die Tabelle aus Abb. 10 um die nötigen Summenstufen und um die Berechung der Zeilenmittelwerte (i) und Spaltenmittelwerte (j) erweitert (Abb. 14):

Abb. 14: Bespieldatensatz erweitert um die Summenstufen

Im Vergleich zur einfaktoriellen Varianzanalyse sieht obige Tabelle (Abb. 14) komplexer aus. Zum erleichterten Verständnis dient die Abb. 15, die die verwendeten Indizes übersichtlich darstellt.
Der Index i steht für die Katalysatoren, der Index j für die pH-Werte und der Index k für die jeweilige Ausprägung der Faktorenstufe in Abhängigkeit Katalysator/pH-Wert.

In der Differenz der Spaltenmittelwerte (j) macht sich der Einfluss des Faktors “pH -Wert”  und in den Differenzen der Zeilenmittelwerte (i) der Einfluss des Faktors “Katalysator” bemerkbar.

Abb. 15: Indizes zur Abb. 14

In den Differenzen der Mittelwerte der Ausprägungen in Abhängigkeit der Faktoren Katalysator/pH-Wert (z. B. 41,6 oder 39,8) macht sich der gemeinsame Einfluss von Katalysator und pH-Wert bemerkbar.
Oder in anderen Worten (was ja im einleitenden Satz zum Thema als vorausgehende Vermutung zur Anwendung der ANOVA gesagt wurde): Jede Ausprägung der unabhängigen Variablen (Faktoren) Katalysator und pH-Wert hat einen Einfluss auf die abhängige Variable (Faktorenstufe) Isomerenverteilung. Bevor die vermutete Beeinflussung der Isomerenverteilung geprüft werden kann, müssen die nötigen SS-Parameter berechnet (geschätzt) werden. Der Einfuss der unabhängigen Merkmale, inklusive der Wechselwirkung zwischen den Faktoren und der zufälligen Streuung, wird durch Formel F14 beschrieben. Die Paramter von F14, bis auf den Anteil der zufälligen Streuung, wird wie folgt geschätzt (siehe auch Abb. 14):

          g:   Gesamtmittelwert
          Ki:      (i - g)              (g: gesamt)
          pj:       (j - g)
          Kpij:   ij - i - j + g = ij -x*ij
           x*ij = i + j - g

Analog der einfaktoriellen Varianzanalyse wird der Einfluss der Faktoren auf die Gesamtstreuung SSt geprüft (siehe F13).
Die Gesamtstreuung SSt wird wie folgt berechnet ...

F15

.... und beträgt SSt = 2541,37 . Die Hauptbeeinflussung (Haupteffekte, main effects) erfolgt (... sollte erfolgen ...) durch die Faktoren K(atalysator) und p(H-Wert) und werden, wie schon angedeutet, über die Abweichung der Zeilen- bzw. Spaltenmittelwerte ((i), (j)) vom Gesamtmittelwert g berechnet:

F16

F17

ni:     Anzahl der Ausprägungen des Faktors
          “Katalysator”
nj:     Anzahl der Ausprägungen des Faktors
          “pH-Wert”
nk:    Anzahl der Beobachtungen pro ni und nj
i: Zeilenmittelwert
j: Spaltenmittelwert
g: Gesamtmittelwert

Und für unser Beispiel auf Basis von Abbildung 14 beträgt

SSK = 2*5[(40,7-51,57)2+(62,8-51,57)2+(51,2-51,57)2] = 2444,07

und

SSp = 3*5[(52,6-51,57)2+(50,53-51,57)2] = 32,14

Die Wechselwirkung zwischen den Faktoren “Katalysator” und “pH-Wert” wird wie folgt geschätzt:

F18

siehe F16/F17
x*ij: i
+ j - g

Der Schätzwert x*ij ist der Mittelwert der als Mittelwert für jede Kombination Katalysator (i) / pH-Wert (j) (siehe Abb. 14) zu erwarten wäre, wenn keine Wechselwirkung vorliegt. Der Schätzwert x*ij muss zur SSK*p-Berechnung zuvor ermittelt werden:

            x*ij = i + j - g

          1. x*11 = 40,7 + 52,6 - 51,57 = 41,73
          2. x*12 = 40,7 + 50,53 - 51,57 = 39,66
          3. x*21 = 62,8 + 52,6 - 51,57 = 63,83
          4. x*22 = 62,8 + 50,53 - 51,57 = 61,76
          5. x*31 = 51,2 + 52,6 - 51,57 = 52,23
          6. x*32 = 51,2 + 50,53 - 51,57 = 50,16

Die Abweichung zwischen beobachtetem Mittelwert (siehe Abb. 14) z.B. für Katalysator A und pH-Wert “sauer” 11 = 41,6 und dem Schätzwert x*11 = 41,73 ist ein Maß für den Wechselwirkungseffekt. Nun kann die SSK*p-Berechnung durchgeführt werden:

SSK*p = 5[(41,6-41,73)2+(39,8-39,66)2+(64-63,83)2+(61,6-61,76)2+(52,2-52,23)2
                 
+(50,2-51,16)2] = 0,47

Jetzt sind wir in der Lage, den SSb-Wert zu berechnen. Wir wissen, dass der SSb-Wert  zusammen gesetzt wird aus der Streuung des Faktors K (SSK), des Faktors p (SSp) und der Wechselwirkung der Faktoren K und p (SSK*p). Somit lässt sich SSb berechnen:

        SSb = SSK + SSp + SSK*p              F19, siehe auch F13

        SSb = 2444,07 + 32,14 + 0,47 = 2476,68

Als letzter Schritt der Berechnung der summierten Abweichungsquadrate wird die “nicht erklärte”, die zufällige Streuung SSw geschätzt.

F20

Hier bemühen wir wieder das Tabellenkalkulationsprogramm, um die Berechnung auf Basis von F20 übersichtlicher zu gestalten (Abb. 16):

Abb. 16, Berechnung von SSw

Der SSw-Wert beträgt 64,8. Die obige Schätzung nach F20 wäre nicht nötig zur Ermittlung des SSw-Wertes gewesen, da mit SSt und SSb auf Basis von F13 bzw. der Streuungszerlegung SSw die Differenz as SSt und SSb ist. Die Berechnung über diesen Weg sollten Sie aus Kontrollgründen durchführen, nur denken Sie an mögliche Rechenungenauigkeiten.

Tragen wir die Werte der Streuung zusammen:

SSt = SSb + SSw
2541,37 = 2476,68 + 64,8

Oder SSb aufgelöst:

SSt = SSK + SSp + SSK*p + SSw
2541,37 = 2444,07 + 32,14 + 0,47 + 64,8

In der nach SSb aufgelösten Form, ist natürlich mehr Information enthalten. Sie können den Anteil der Hauptbeeinflussungen durch die Faktoren, hier SSK und SSp, abschätzen. Dadurch können Sie erkennen, dass der Einfluss von SSp (32,14) im Vergleich zu SSK (2444,07) sehr gering ist. Hinzu kommt der bedenkliche Vergleich zwischen SSp und SSw (64,8).

Kommen wir zur statistischen Prüfung auf unterschiedlichen Einfluss der beiden Faktoren. Die Berechnung der SS-Werte erfolgt über die Mittelwerte und darauf formulieren wir unser Hypothesen. Sind alle Mittelwerte gleich, kann angenommen werden, dass keine Beeinflussung der jeweiligen Faktorenstufe (Ausbeute Isomer I) vorliegt (Nullhypothese H0). Die Alternativhypothese H1 liegt dann vor, wenn mindestens ein Faktor Auswirkungen auf die Faktorstufe zeigt.
Ebenso werden die Hypothesen bezüglich der Wechselwirkung zwischen den Faktoren formuliert: Hier lautet die Nullhypothese H0, es gibt keine Wechselwirkung - auf Basis der Mittelwerte - zwischen den Faktoren, oder als Alternativhypothese H1 das eine Wechselwirkung vorliegt.
Zur Berechnung der  Prüfgröße PG wird der Freiheitsgraden df benötigt. Die Ermittlung der Freiheitsgrade wird hier übersichtlich dargestellt:

          df SSK = i - 1 = 3 - 1 = 2
          df SSp = j - 1 = 2 -1 = 1
          df SSK*p = ( i - 1)(j - 1) = 2 * 1 = 2
          df SSw = i * j * (k - 1) = 3 * 2 * (5 - 1) =  24
          df SSt = i * j * k -1 = 3 * 2 * 5 - 1 = 29

Aus den SS-Werten und den zugehörigen Freiheitsgraden wird die Varianz berechnet (Abb. 17):

Varianzherkunft:

SS-Wert:

df:

Varianz:

Haupteinfluss
     Katalysator  (K)
     pH-Wert (p)


2444,07
32,14


2
1


1222,04
32,14

Wechselwirkung
    Katalysator/pH-Wert (K*p)


0,47


2


0,24

Nicht erklärte (zufällige) Streuung (w)

64,8

24

2,7

Gesamtabweichung (t)

2541,37

29

87,63

Abb. 17: Tabelle der Varianzen

Die Prüfgröße PG wird durch Division der Varianzen mit der Varianz der “Nicht erklärten Streuung (w)” (gelbe Zeile, siehe F12) berechnet und neben den tabellarischen F-Werten und Hypothesen tabellarisch dargestellt (Abb.18):

Varianzherkunft:

PG:

F-Wert
(P=97,5%)

dfZähler

dfNenner

Hypothese?

Haupteinfluss
     Katalysator  (K)
     pH-Wert (p)


452,6
11,9


4,32
5,72


2
1


24
24


PG>F, H0 wird verworfen
PG>F, H0 wird verworfen

Wechselwirkung
    Katalysator/ pH-Wert (K*p)

0,09

4,32

2

24

PG<F, H0 trifft zu

Abb. 18: Prüfung der Hypothesen

Mit einer Wahrscheinlichkeit P=97,5% zeigen die Faktoren Katalysator und pH-Wert einen Einfluss auf die Faktorenstufe (abhängiges Merkmal). Ebenso liegt mit einer Wahrscheinlichkeit P=97,5% keine Wechselwirkung zwischen den Faktoren Katalysator und pH-Wert vor.

Das hier gezeigte Beispiel kann als OpenOffice Tabelle (*.ods) geladen werden. Sie können dieses Beispiel mit der R-Funktion anova_faes berechnen. Es werden auch - wenn gewünscht - Zwischenergebnisse ausgegeben.

Bemerkungen zur Varianzanalyse

Die Varianzanalyse ist ein strukturprüfendes Verfahren. Das bedeutet, dass die Frage, die durch die Varianzanalyse beantwortet werden soll, sich nicht erst aus den Daten ergeben darf. Von den Daten des unabhängigen sowie des abhängigen Merkmals und der Hypothese hängt die inhaltliche Relevanz der Aussage ab. Es wird keine Aussage über die Stärke des Zusammenhangs gemacht. Siehe hierzu auch Abb. 18.
Natürlich müssen sich die Faktoren unterscheiden, sonst lässt sich die Varianz bezüglich der abhängigen Variable nicht eindeutig auf die Faktoren zurückführen. Das hat auch zur Folge, dass die unabhängigen Variablen sich additiv (linearer Modellansatz) verhalten müssen. Dies ist eine der Voraussetzungen zur Varianzanalyse und wird mit dem Begriff Additivität der unabhängigen Variablen bezeichnet. Für die einfaktorielle Varianzanalyse bedeutet dies, dass auch die zufällige Streuung keinen Einfluss auf die unabhängige Variable ausübt.
Eine weitere Voraussetzung zur Varianzanalyse ist die Normalverteilung der Grundgesamtheit. Das bedeutet dann natürlich auch, dass die Stichprobe (die Beobachtungen) genügend groß ist und nicht durch systematische Effekte bezüglich der Grundgesamtheit nicht mehr repräsentativ ist.
 

Seitenanfang

Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen?