Zeitreihenanalyse | ||||||||||||
Was ist eine Zeitreihe? Eine Zeitreihe entsteht, wenn zu einem Merkmal Y an aufeinander folgenden Zeitpunkten t (Zeitperiode t = 1,..., n) Beobachtungen yt durchgeführt werden. Diese zeitlich geordneten Beobachtungen yt des Merkmals Y bilden die Zeitreihe: Eine Zeitreihe ist eine zeitlich geordnete Folge von Beobachtungen. Das Ziel der Zeitreihenanalyse ist, Strukturen und Regelmäßigkeiten in Zeitreihen aufzudecken und zur Beschreibung oder Modellierung zu nutzen. Bekannte Beispiele für Zeitreihen sind Aktienkurse (nur wenn online: OnVista.de ), Statistiken der Bundesanstalt für Arbeit (Arbeitslosenstatistik), der Preisindex bezüglich der Lebenshaltungskosten, Wetterdaten usw.. Sie führen sicher Ihre eigene Zeitreihe, wenn Sie an “Ihrer” Tankstelle vorbeifahren und die Preisentwicklung des benötigten Treibstofftypes beobachten.
Die Ausprägung des beobachteten Merkmals ist metrisch. Die Ausprägung kann aber durchaus ein Index sein, wie z. B. ein gewichteter Mittelwert oder eine qualitative Aussage wie”gut”, “befriedigend” oder “schlecht”, welche in einen Index transformiert wurde. Betrachten wir als Zeitreihenbeispiel die Rohölpreisentwicklung (Abb.1): |
||||||||||||
Abbildung 1: Rohölpreis | ||||||||||||
In der Zeitreihenanalyse interessiert immer die Fragestellung, ob
Darüber hinaus wird der Versuch unternommen, auf Basis der vorliegenden Zeitreihe
zu erstellen. Auch die Frage der
ist von Bedeutung. Eine Zeitreihe besteht aus Komponenten (Komponentenmodell), der systematischen und irregulären (Rest-)Komponente. Die systematischen Komponenten sind Trend, Saison und weitere erklärbare Effekte.
Das additive Komponentenmodell Für dieses Modell wird angenommen, dass sich die Komponenten k additiv verhalten: yt = k1t + k2t + ... + et t = 1, ..., n k1: Trendkomponente Die Trendkomponente k1 (oder auch m) steht für systematische Veränderungen, etwa ein lineares oder exponentielles Wachstum. Die Saisonkomponente k2 (oder s) beinhaltet saisonal wiederkehrende Veränderungen. Als Beispiel sei hier die jahreszeitlichen Veränderungen in der Arbeitslosenstatistik für das Baugewerbe in den Wintermonaten genannt. Wenn wir nun schon bei der Arbeitslosenstatistik sind, kann die ...-Komponente durchaus die Konjunkturkomponente sein. Lassen sich Komponenten im Modell nicht exakt trennen (also getrennt beschreiben), werden diese zur glatten Komponente g zusammengefasst. Dadurch wird das additive Modell vereinfacht zum Trend-Saison-Modell: yt = gt + st + et t = 1, ..., n Neben dem additiven Modell findet das multiplikative Modell Anwendung: yt = gt * st * et t = 1, ..., n Bei diesen Modellen besteht eine Ähnlichkeit zu Regressionsmodellen. Es ist aber zu beachten, das Trend und Saison unbeobachtbare Funktionen sind, die über die Zeitreihenanalyse geschätzt werden. Zur Schätzung dieser Komponenten wird von einem globalen oder lokalem Ansatz ausgegangen. Globaler Ansatz Globale Trendmodelle sind (sollen) über den gesamten beobachteten Zeitbereich gültig (sein). Globale Modelle sind dadurch starrer als die später dargelegten lokale Modelle. Der einfachere Fall des globalen Ansatz ist das reine Trendmodell yt = gt + et da es sich auf das Schätzen der Trendkomponente gt reduziert. Diese Schätzung erfolgt über die Regressionsanalyse und die lineare Trendfunktion gt = a0 + a1t + et ist Ihnen sicher geläufig. Wie auch im Bereich der Regressionsanalyse beschrieben, kommen auch Funktionen, wie quadratische, exponentielle usw. als Trendfunktion in Frage. Bei polynomialen Modellen höherer Ordnung ist zu berücksichtigen, dass sie außerhalb des Datenbereiches instabil sind und deswegen für Prognosezwecke ungeeignet sein können. In Abbildung 2 wird, trotz des spekulativen Anteils, von einem linearen Trend ausgegangen und die Regressionsgerade eingezeichnet: | ||||||||||||
Abbildung 2: Rohölpreis mit linearen Trend |
Die lineare Trendfunktion gt aus Abbildung 2 nimmt folgende Parameter an: gt = a0 + a1t + et gt = 62.871 + 1.174t + et Das Bestimmtheitsmaß als Gütemaß für Trendschätzung ist mit r2 = 0.6731 nicht wirklich gut. Die Restkomponente et zeigt an den Stellen kleinster Wert (Min), 1 Quantil (1Q), Median, 3 Quantil (3Q) und größter Wert (Max) folgende Abstände: Residuals: Hinweis: Die Abbildungen 2, 4 ,5, 6 und die Schätzung der Regression (Trendfunktion) wurde mit dem Statistikprogramm R durchgeführt. Wenn Ihnen R nicht geläufig ist und Sie es kennen lernen möchten, bietet Ihnen das Buch Einführung in R einen einfachen Einstieg. Die Ursache des geschätzten Bestimmtheitsmaß von r2 = 0.6731 kann in dem Vorhandensein einer Saisonkomponente s begründet sein. Um das besser beurteilen zu können, glätten wir die Zeitreihe. |
|
|
Die geglättete Zeitreihe besitzt demzufolge nur noch n - 2m Werte! Abbildung 3 zeigt beispielhaft eine 3-Punkte- und eine 5-Punkte-Glättung. Die Farben und Pfeile sollen andeuten, wie die geglätteten Mittelwerte zustande gekommen sind. Durch Glättungen können große unregelmäßige Schwankungen aus Zeitreihen ausgeglichen und die glatte Komponente g (oder im reinen Trendmodell der Trend gt) besser geschätzt werden. Abbildung 4 zeigt den grafischen Verlauf der 3-Punkte- und 5-Punkte-Glättung: |
Abbildung 4: 3-Punkte- und 5-Punkte-Glättung |
Wie zu erwarten, mit zunehmender Glättung werden größere Schwankungen im Vergleich zur Abbildung 2 entfernt. Die Schätzung der Trendfunktion gt erfährt allerdings keine wesentliche Verbesserung. Für weiter Glättungsverfahren (Filter) sei auf die oben genannten Literaturstellen verwiesen. Im Trend-Saison-Modell... yt = gt + st + et t = 1, ..., n kann eine Saisonkomponente st nach Eliminierung der Trendkomponete gt sichtbar werden. Hier spielt die Schätzungsgüte der Trendkomponete gt natürlich eine wesentliche Rolle. Je besser die Schätzung ist, desto besser kann die Saisonkomponente st geschätzt werden. |
|
Die Trendeliminierung auf die Daten aus Abbildung 2 angewandt, zeigt folgendes Bild (Abbildung 5): |
Abbildung 5: Trendeliminierte Zeitreihe |
Liegt eine Saisonkomponete st in obiger Zeitreihe (Abb. 5) vor, kann sie erkannt und geschätzt werden. Eine jahreszeitlich bedingte Saisonkomponete kann eine Periode p = 12 Monate besitzen. Z. B. könnte in obiger trendbereinigter Zeitreihe in den Sommermonaten der Rohölpreis besonders hoch sein. Um die Saisonkomponete st schätzen zu können, müssen Annahmen über das Funktionsmodell gemacht werden. Hierzu sei auch auf die oben erwähnten Literaturstellen verwiesen! Lokaler Ansatz Für längere Zeitreihen sind globale Ansätze oft zu starr. Für sich zeitlich ändernde
Strukturen sind lokale Ansätze besser geeignet. |
Abbildung 6: Lokale Regression |
|
Vergleichen Sie die Daten mit dem globalen Ansatz und machen Sie sich Ihr eigenes Bild. Die Herausforderungen zur Schätzung der Trend- oder Saisonkomponente sind die gleichen, wobei bei den Aussagen zur Zeitreihe natürlich der betrachtete Zeitraum (Fenster) eine wesentliche Rolle spielt. |
Hat der Inhalt Ihnen weitergeholfen und Sie möchten diese Seiten unterstützen? |