Sunday 26 November 2017

Bewegliche Kiste Jenkins


Das Box-Jenkins ARMA-Modell ist eine Kombination aus den AR - und MA-Modellen (auf der vorherigen Seite beschrieben): start Xt delta phi1 X phi2 X cdots phip X A - theta1 A - theta2 A - cdots - thetaq A. Wobei die Ausdrücke in der Gleichung dieselbe Bedeutung haben wie für das AR - und MA-Modell. Kommentare zu Box-Jenkins Model Ein paar Anmerkungen zu diesem Modell. Das Box-Jenkins-Modell geht davon aus, dass die Zeitreihe stationär ist. Box und Jenkins empfiehlt, nichtstationäre Serien ein oder mehrere Male zu differenzieren, um Stationarität zu erreichen. So entsteht ein ARIMA-Modell, mit dem ich für Integrated stehe. Einige Formulierungen transformieren die Reihe, indem sie den Mittelwert der Reihe von jedem Datenpunkt subtrahieren. Dies ergibt eine Reihe mit einem Mittelwert von null. Ob Sie dies tun müssen oder nicht ist abhängig von der Software, die Sie verwenden, um das Modell zu schätzen. Box-Jenkins Modelle können erweitert werden, um saisonale autoregressive und saisonale gleitende durchschnittliche Bedingungen. Obwohl dies die Notation und die Mathematik des Modells kompliziert, sind die zugrundeliegenden Konzepte für saisonale autoregressive und saisonale gleitende Durchschnittsterme ähnlich zu den nicht-saisonalen autoregressiven und gleitenden Durchschnittstermen. Das allgemeinste Box-Jenkins-Modell umfasst Differenzoperatoren, autoregressive Terme Durchschnittliche Konditionen, saisonale Differenzenoperatoren, saisonale autoregressive Begriffe und saisonale gleitende Durchschnittskonditionen. Wie bei der Modellierung im Allgemeinen sollten jedoch nur notwendige Begriffe in das Modell aufgenommen werden. Wer sich für die mathematischen Details interessiert, kann auf Box, Jenkins und Reisel (1994) eingehen. Chatfield (1996). Oder Brockwell und Davis (2002). Stufen in Box-Jenkins Modellierung Die folgenden Bemerkungen zu den Box-Jenkins-Modellen sind zu beachten. Box-Jenkins-Modelle sind sehr flexibel aufgrund der Einbeziehung der beiden autoregressive und gleitende durchschnittliche Begriffe. Ausgehend von der dort nicht dargestellten Wold-Zerlegung kann ein stationärer Vorgang durch ein ARMA-Modell approximiert werden. In der Praxis findet man, dass die Annäherung nicht einfach sein kann. Chatfield (1996) empfiehlt Zersetzungsmethoden für Serien, in denen der Trend und die saisonalen Komponenten dominant sind. Gebrauch von guten ARIMA-Modellen erfordert in der Regel mehr Erfahrung als häufig verwendete statistische Methoden wie Regression. Ausreichend lange Serie erforderlich Typischerweise erfordert eine effektive Montage von Box-Jenkins-Modellen mindestens eine mäßig lange Serie. Chatfield (1996) empfiehlt mindestens 50 Beobachtungen. Viele andere würden mindestens 100 Beobachtungen empfehlen. Der erste Schritt bei der Entwicklung eines Box-Jenkins-Modells besteht darin, festzustellen, ob die Serie stationär ist und ob es eine signifikante Saisonalität gibt, die modelliert werden muss. Stationarität kann anhand eines Ablaufablaufplots beurteilt werden. Das Ablaufdiagramm sollte eine konstante Position und Skalierung aufweisen. Es kann auch aus einem Autokorrelationsdiagramm nachgewiesen werden. Insbesondere wird die Nichtstationarität oft durch eine Autokorrelationsdiagramm mit sehr langsamem Abfall angezeigt. Differenzierung zur Stationarität Box und Jenkins empfehlen den differenzierenden Ansatz, um Stationarität zu erreichen. Jedoch kann auch das Anpassen einer Kurve und das Subtrahieren der angepassten Werte aus den ursprünglichen Daten auch im Zusammenhang mit Box-Jenkins-Modellen verwendet werden. Bei der Modellidentifizierungsphase ist es unser Ziel, jahreszeitliche Erkennung, falls vorhanden, zu erkennen und den Auftrag für die saisonalen autoregressiven und saisonal gleitenden Durchschnittsbedingungen zu ermitteln. Für viele Serien ist die Periode bekannt und ein einzelner Saisonalitätsausdruck ist ausreichend. Zum Beispiel für monatliche Daten würden wir typischerweise entweder eine saisonale AR 12 Begriff oder eine saisonale MA 12 Begriff. Bei Box-Jenkins-Modellen wird das Modell vor der Montage nicht explizit entfernt. Stattdessen beinhalten wir die Reihenfolge der Saisonbegriffe in der Modellspezifikation zur ARIMA-Schätzsoftware. Es kann jedoch hilfreich sein, einen saisonalen Unterschied zu den Daten anzuwenden und die Autokorrelation und die partiellen Autokorrelationsdiagramme zu regenerieren. Dies kann bei der Modellidentifizierung der nicht-saisonalen Komponente des Modells helfen. In einigen Fällen kann die saisonale Differenzierung die meisten oder alle der Saisonalität Wirkung zu entfernen. Identifizieren Sie p und q Sobald die Stationarität und die Saisonalität adressiert worden sind, besteht der nächste Schritt darin, die Reihenfolge (d. h. (p) und (q)) der autoregressiven und gleitenden Durchschnittsterme zu identifizieren. Autokorrelation und partielle Autokorrelationsdiagramme Die primären Werkzeuge dafür sind das Autokorrelationsdiagramm und das partielle Autokorrelationsdiagramm. Die Stichproben-Autokorrelationsdiagramm und die Stichproben-Autokorrelationsdiagramm werden mit dem theoretischen Verhalten dieser Diagramme verglichen, wenn die Reihenfolge bekannt ist. Reihenfolge des Autoregressiven Prozesses ((p)) Speziell für ein AR (1) - Verfahren sollte die Autokorrelationsfunktion der Probe eine exponentiell abnehmende Erscheinung aufweisen. AR-Prozesse höherer Ordnung sind jedoch oft ein Gemisch aus exponentiell abnehmenden und gedämpften sinusförmigen Komponenten. Für autoregressive Prozesse höherer Ordnung muss die Stichproben-Autokorrelation mit einem partiellen Autokorrelationsdiagramm ergänzt werden. Die partielle Autokorrelation eines AR ((p)) - Prozesses wird bei Verzögerung (p & sub1;) und grßer, so dass wir die partielle Autokorrelationsfunktion untersuchen, um festzustellen, ob es einen Beweis für eine Abweichung von Null gibt. Dies wird in der Regel durch das Platzieren eines 95-Konfidenzintervalls auf das partielle Autokorrelationsdiagramm der Probe bestimmt (die meisten Softwareprogramme, die Beispiel-Autokorrelationsdiagramme erzeugen, werden ebenfalls dieses Konfidenzintervall aufzeichnen). Wenn das Softwareprogramm nicht das Konfidenzband erzeugt, beträgt es ungefähr (pm 2 / sqrt), wobei (N) die Stichprobengröße ist. Ordnung des gleitenden Durchschnittsprozesses ((q)) Die Autokorrelationsfunktion eines MA ((q)) Prozesses wird bei der Verzögerung (q & sub1;) und größer größer, so dass wir die Autokorrelationsfunktion der Probe untersuchen, um zu sehen, wo sie im Wesentlichen Null wird. Wir tun dies, indem wir das 95-Konfidenzintervall für die Stichproben-Autokorrelationsfunktion auf das Stichproben-Autokorrelationsdiagramm legen. Die meisten Software, die das Autokorrelationsdiagramm erzeugen kann, kann auch dieses Konfidenzintervall erzeugen. Die partielle Autokorrelationsfunktion ist im Allgemeinen nicht hilfreich, um die Reihenfolge des gleitenden Durchschnittsprozesses zu bestimmen. Form der Autokorrelationsfunktion Die folgende Tabelle fasst zusammen, wie wir die Beispiel-Autokorrelationsfunktion für die Modellidentifikation verwenden. Forecasting 101: Box-Jenkins Die Prognose von Box-Jenkins (ARIMA) ist eine wichtige Prognosemethode, die hochpräzise Prognosen für bestimmte Datentypen liefern kann. In dieser Tranche von Forecasting 101 untersuchen Sie die Vor-und Nachteile der Box-Jenkins-Modellierung, bieten einen konzeptionellen Überblick, wie die Technik funktioniert und diskutieren, wie sie am besten auf Geschäftsdaten anzuwenden. Ein bisschen Geschichte Im Jahr 1970 George Box und Gwilym Jenkins popularisiert ARIMA (Autoregressive Integrated Moving Average) Modelle in ihrem seminal Lehrbuch, Zeitreihenanalyse: Prognose und Kontrolle 1. Technisch gesehen, ist die Prognose-Technik im Text beschrieben, ein ARIMA-Modell, aber viele Prognostiker (einschließlich des Autors) verwenden die Formulierungen ARIMA-Modelle und Box-Jenkins-Modelle austauschbar. ARIMA-Modelle erzeugten zunächst eine große Aufregung in der akademischen Gemeinschaft, vor allem aufgrund ihrer theoretischen Grundlagen, die bewiesen, dass, wenn bestimmte Annahmen erfüllt waren, die Modelle optimale Prognosen liefern würden. Früher war die Technik nicht weit verbreitet in der Wirtschaft. Dies war hauptsächlich auf die schwierige, zeitaufwändige und höchst subjektive Prozedur zurückzuführen, die von Box und Jenkins beschrieben wurde, um die richtige Form des Modells für einen gegebenen Datensatz zu identifizieren. Um noch schlimmer zu werden, zeigten empirische Studien, dass die Modelle trotz der theoretischen Überlegenheit der ARIMA-Modelle gegenüber anderen Prognosemethoden in der Praxis nicht routinemäßig andere Zeitreihenmethoden übertrafen. Eine besonders wichtige empirische Studie ergab, dass exponentielle Glättungsmodelle die Box-Jenkins 55 der Zeit auf einer Stichprobe von 1.001 Datensätzen übertrafen. 2. Dies ist immer noch ein gutes Ergebnis für Box-Jenkins (es übertraf exponentielle Glättung 45 der Zeit), so dass die Dass idealerweise man zwischen verschiedenen Ansätzen wechseln würde, anstatt einen Ansatz zu nehmen. Die Herausforderung für einen Unternehmensprognostiker besteht darin, zu bestimmen, welche Datensätze für Box-Jenkins am besten geeignet sind und dann die richtige Form des Modells zu identifizieren. Der obige Screenshot zeigt die Prognose eines ARIMA-Modells zusammen mit der Expertenselektionslogik und den Modelldetails. Heute verwenden Softwarepakete wie Forecast Pro automatische Algorithmen, um zu entscheiden, wann man Box-Jenkins-Modelle verwendet und um automatisch die richtige Form des Modells zu identifizieren. Diese automatischen Ansätze haben gezeigt, dass sie die manuellen Identifizierungsverfahren übertreffen und die Box-Jenkins-Modelle für die Geschäftsprognosegemeinschaft zugänglich gemacht haben. 3 Obwohl multivariate Formen von ARIMA-Modellen existieren, ist der meiste Geschäftsgebrauch der Methode als eine Zeitreihenvorhersagetechnik . (Zeitreihenmethoden sind Prognosetechniken, die die Prognose ausschließlich auf die Historie des von Ihnen prognostizierten Elements abstimmen.) Als Zeitreihentechnik sind ARIMA-Modelle geeignet, wenn Sie eine vernünftige Kontinuität zwischen Vergangenheit und Zukunft annehmen können. Die Modelle eignen sich am besten für kürzere Vorhersagen8212sie 18 Monate oder weniger8212die Annahme, dass zukünftige Muster und Trends den aktuellen Mustern und Trends entsprechen werden. Dies ist eine vernünftige Annahme in der kurzen Frist, sondern wird mehr Tenuous desto weiter, die Sie prognostizieren. Box-Jenkins-Modelle ähneln exponentiellen Glättungsmodellen, indem sie adaptiv sind, Trends und saisonale Muster modellieren und automatisiert werden können. Sie unterscheiden sich darin, dass sie auf Autokorrelationen (Muster in der Zeit) und nicht auf eine strukturelle Betrachtung von Niveau, Trend und Saisonalität basieren. Box-Jenkins tendenziell besser als exponentielle Glättung für längere, stabilere Datensätze und nicht auch für lautere, volatilere Daten. Box-Jenkins-Modelle sind mathematisch komplex. In diesem Artikel werden wir einen sehr grundlegenden konzeptionellen Überblick darüber, wie ein ARIMA-Modell funktioniert und führen einige Notation im Zusammenhang mit dem Modell. Wenn Sie interessiert sind, mehr über Box-Jenkins-Modelle zu erfahren, werden sie detailliert im Statistical Reference Manual von Forecast und in praktisch jedem akademischen Lehrbuch über Zeitreihenprognosen behandelt. Ein ARIMA-Modell verfügt über 3 Komponenten, die jeweils zur Modellierung verschiedener Arten von Mustern beitragen. Die AR steht für autoregressive. Das I steht für integriert. Der MA steht für gleitenden Durchschnitt. Jede Komponente hat eine zugehörige Modellreihenfolge, die angibt, wie groß die Komponente ist. Generell wird ein nicht-saisonales Box-Jenkins-Modell als ARIMA (p, d, q) symbolisiert, wobei p die Anzahl der AR-Terme angibt, d die Reihenfolge der Differenzierung angibt und q die Anzahl der MA-Terme angibt. Ein saisonales Box-Jenkins-Modell wird als ARIMA (p, d, q) (P, D, Q) symbolisiert, wobei p, d, q die Modellordnungen für die kurzfristigen Komponenten des Modells und P, Q geben die Modellordnungen für die saisonalen Komponenten des Modells an. Die Identifizierung der richtigen Box-Jenkins-Modelle erfordert die Bestimmung der Modell-Bestellungen. Theoretisch könnten die Modellordnungen beliebige ganzzahlige Werte annehmen, die in der Praxis üblicherweise 0, 1, 2 oder 3 betragen. Dies ergibt immer noch Hunderte von verschiedenen Modellen, die die Gründe dafür berücksichtigen, warum die manuelle Identifizierung der Modelle so schwierig ist. Box-Jenkins ist eine wichtige Vorhersagemethode, die genauere Prognosen als andere Zeitreihenmethoden für bestimmte Arten von Daten erzeugen kann. Wie ursprünglich formuliert, beruhte die Modellidentifizierung auf einem schwierigen, zeitraubenden und höchst subjektiven Verfahren. Heute verwenden Softwarepakete wie Forecast Pro automatische Algorithmen, um beide entscheiden, wann man Box-Jenkins-Modelle verwenden und automatisch die richtige Form des Modells zu identifizieren. Diese automatischen Ansätze machen Box-Jenkins Modelle zugänglich und nützlich für die Business Prognose Prognose Gemeinschaft. 1 G. E. P. Box und G. M. Jenkins 1976 Zeitreihenanalyse: Prognose und Kontrolle. Überarbeitete Ausgabe, San Francisco: Holden-Tag. 2 S. Makridakis et al. 1984 Die Prognosegenauigkeit der Zeitreihenmethoden. Chichister: Wiley. 3 Eine Studie von Spyros Makridakis und eine von den amerikanischen Statistiker sowohl Prognosen Pros automatische Box-Jenkins Verfahren, um die manuelle Identifikation von menschlichen Experten übertreffen. Siehe die vorherige Makridakis Referenz und zu: Keith Ord und Sam Lowe 1996 automatische Prognose, der amerikanische Statistiker. Band 50, Nr. 1, S. 88 94. Über den Autor: Eric Stellwagen ist Mitbegründer von Business Forecast Systems, Inc und Co-Autor der Pro - gramm Pro Software. Er hat weitgehend im Bereich der praktischen Business-Prognose konsultiert und verbringt 20-30 Tage im Jahr präsentiert Workshops zu diesem Thema. Er arbeitete mit vielen führenden Firmen wie Coca-Cola, Procter Gamble, Merck, Blue Cross Blue Shield, Nabisco, Owens-Corning und Verizon zusammen. Er hat Seminare und Workshops unter der Ägide vieler Gruppen, darunter das Institut für Berufsbildung, die American Production and Inventory Control Society, die University of Wisconsin, das Institut für Business Forecasting, die Weltforschungsgruppe, das Internationale Institut für Forschung, Electric Power Research Institute, die International Communications Forecasting Association und das Internationale Institut für Forecasters. Er ist derzeit Mitglied im Board of Directors des International Institute of Forecasters und auf der Practitioner Advisory Board of Foresight: Die Internationale Zeitschrift für Angewandte Prognose. A RIMA steht für Autoregressive Integrated Moving Average Modelle. Univariate (Einzelvektor) ARIMA ist eine Prognosemethode, die die zukünftigen Werte einer Serie, die vollständig auf ihrer eigenen Trägheit basiert, projiziert. Seine Hauptanwendung liegt im Bereich der kurzfristigen Prognose mit mindestens 40 historischen Datenpunkten. Es funktioniert am besten, wenn Ihre Daten eine stabile oder konsistente Muster im Laufe der Zeit mit einem Minimum an Ausreißern zeigt. Manchmal nennt man Box-Jenkins (nach den ursprünglichen Autoren), ARIMA ist in der Regel überlegen exponentielle Glättung Techniken, wenn die Daten relativ lange und die Korrelation zwischen vergangenen Beobachtungen ist stabil. Wenn die Daten kurz oder stark flüchtig sind, kann eine gewisse Glättungsmethode besser ablaufen. Wenn Sie nicht über mindestens 38 Datenpunkte verfügen, sollten Sie eine andere Methode als ARIMA betrachten. Der erste Schritt bei der Anwendung der ARIMA-Methodik ist die Überprüfung der Stationarität. Stationarität impliziert, dass die Reihe auf einem ziemlich konstanten Niveau über Zeit bleibt. Wenn ein Trend besteht, wie in den meisten wirtschaftlichen oder geschäftlichen Anwendungen, dann sind Ihre Daten nicht stationär. Die Daten sollten auch eine konstante Varianz in ihren Schwankungen im Laufe der Zeit zeigen. Dies ist leicht zu sehen mit einer Serie, die stark saisonal und wächst mit einer schnelleren Rate. In einem solchen Fall werden die Höhen und Tiefen der Saisonalität im Laufe der Zeit dramatischer. Ohne dass diese Stationaritätsbedingungen erfüllt sind, können viele der mit dem Prozess verbundenen Berechnungen nicht berechnet werden. Wenn eine grafische Darstellung der Daten Nichtstationarität anzeigt, dann sollten Sie die Serie unterscheiden. Die Differenzierung ist eine hervorragende Möglichkeit, eine nichtstationäre Serie in eine stationäre zu transformieren. Dies geschieht durch Subtrahieren der Beobachtung in der aktuellen Periode von der vorherigen. Wenn diese Transformation nur einmal zu einer Reihe erfolgt, sagen Sie, dass die Daten zuerst unterschieden wurden. Dieser Prozess im Wesentlichen eliminiert den Trend, wenn Ihre Serie wächst mit einer ziemlich konstanten Rate. Wenn es mit steigender Rate wächst, können Sie das gleiche Verfahren anwenden und die Daten erneut differenzieren. Ihre Daten würden dann zweite differenziert werden. Autokorrelationen sind Zahlenwerte, die angeben, wie sich eine Datenreihe mit der Zeit auf sich bezieht. Genauer gesagt misst es, wie stark Datenwerte bei einer bestimmten Anzahl von Perioden auseinander über die Zeit miteinander korreliert werden. Die Anzahl der Perioden wird in der Regel als Verzögerung bezeichnet. Zum Beispiel misst eine Autokorrelation bei Verzögerung 1, wie die Werte 1 Periode auseinander über die gesamte Reihe miteinander korreliert sind. Eine Autokorrelation bei Verzögerung 2 misst, wie die Daten, die zwei Perioden voneinander getrennt sind, über die gesamte Reihe miteinander korrelieren. Autokorrelationen können im Bereich von 1 bis -1 liegen. Ein Wert nahe 1 gibt eine hohe positive Korrelation an, während ein Wert nahe -1 impliziert eine hohe negative Korrelation. Diese Maßnahmen werden meist durch grafische Darstellungen, sogenannte Korrelagramme, ausgewertet. Ein Korrelationsdiagramm zeigt die Autokorrelationswerte für eine gegebene Reihe bei unterschiedlichen Verzögerungen. Dies wird als Autokorrelationsfunktion bezeichnet und ist bei der ARIMA-Methode sehr wichtig. Die ARIMA-Methodik versucht, die Bewegungen in einer stationären Zeitreihe als Funktion der so genannten autoregressiven und gleitenden Durchschnittsparameter zu beschreiben. Diese werden als AR-Parameter (autoregessiv) und MA-Parameter (gleitende Mittelwerte) bezeichnet. Ein AR-Modell mit nur einem Parameter kann als geschrieben werden. X (t) A (1) X (t-1) E (t) wobei X (t) Zeitreihen A (1) der autoregressive Parameter der Ordnung 1 X (t-1) (T) der Fehlerterm des Modells Dies bedeutet einfach, dass jeder gegebene Wert X (t) durch eine Funktion seines vorherigen Wertes X (t-1) plus einen unerklärlichen Zufallsfehler E (t) erklärt werden kann. Wenn der geschätzte Wert von A (1) 0,30 betrug, dann wäre der aktuelle Wert der Reihe mit 30 seines vorherigen Wertes 1 verknüpft. Natürlich könnte die Serie auf mehr als nur einen vergangenen Wert bezogen werden. Zum Beispiel ist X (t) A (1) X (t-1) A (2) X (t-2) E (t) Dies zeigt an, dass der aktuelle Wert der Reihe eine Kombination der beiden unmittelbar vorhergehenden Werte ist, X (t-1) und X (t-2) zuzüglich eines Zufallsfehlers E (t). Unser Modell ist nun ein autoregressives Modell der Ordnung 2. Moving Average Models: Eine zweite Art von Box-Jenkins-Modell wird als gleitendes Durchschnittsmodell bezeichnet. Obwohl diese Modelle dem AR-Modell sehr ähnlich sind, ist das Konzept dahinter ganz anders. Bewegliche Durchschnittsparameter beziehen sich auf das, was in der Periode t stattfindet, nur auf die zufälligen Fehler, die in vergangenen Zeitperioden aufgetreten sind, dh E (t-1), E (t-2) usw. anstatt auf X (t-1), X T-2), (Xt-3) wie in den autoregressiven Ansätzen. Ein gleitendes Durchschnittsmodell mit einem MA-Begriff kann wie folgt geschrieben werden. X (t) - B (1) E (t-1) E (t) Der Begriff B (1) wird als MA der Ordnung 1 bezeichnet. Das negative Vorzeichen vor dem Parameter wird nur für Konventionen verwendet und in der Regel ausgedruckt Automatisch von den meisten Computerprogrammen. Das obige Modell sagt einfach, dass jeder gegebene Wert von X (t) direkt nur mit dem Zufallsfehler in der vorherigen Periode E (t-1) und mit dem aktuellen Fehlerterm E (t) zusammenhängt. Wie im Fall von autoregressiven Modellen können die gleitenden Durchschnittsmodelle auf übergeordnete Strukturen mit unterschiedlichen Kombinationen und gleitenden mittleren Längen erweitert werden. Die ARIMA-Methodik erlaubt es auch, Modelle zu erstellen, die sowohl autoregressive als auch gleitende Durchschnittsparameter zusammenführen. Diese Modelle werden oft als gemischte Modelle bezeichnet. Obwohl dies für eine kompliziertere Prognose-Tool macht, kann die Struktur tatsächlich simulieren die Serie besser und produzieren eine genauere Prognose. Pure Modelle implizieren, dass die Struktur nur aus AR oder MA-Parameter besteht - nicht beides. Die Modelle, die von diesem Ansatz entwickelt werden, werden in der Regel als ARIMA-Modelle bezeichnet, da sie eine Kombination aus autoregressiver (AR), Integration (I) verwenden, die sich auf den umgekehrten Prozess der Differenzierung bezieht, um die Prognose zu erzeugen. Ein ARIMA-Modell wird üblicherweise als ARIMA (p, d, q) angegeben. Dies ist die Reihenfolge der autoregressiven Komponenten (p), der Anzahl der differenzierenden Operatoren (d) und der höchsten Ordnung des gleitenden Mittelwerts. Beispielsweise bedeutet ARIMA (2,1,1), dass Sie ein autoregressives Modell zweiter Ordnung mit einer gleitenden mittleren Komponente erster Ordnung haben, deren Serie einmal differenziert wurde, um die Stationarität zu induzieren. Auswahl der richtigen Spezifikation: Das Hauptproblem in der klassischen Box-Jenkins versucht zu entscheiden, welche ARIMA-Spezifikation zu verwenden - i. e. Wie viele AR - und / oder MA-Parameter eingeschlossen werden sollen. Dies ist, was viel von Box-Jenkings 1976 dem Identifikationsprozeß gewidmet wurde. Es hing von der graphischen und numerischen Auswertung der Stichprobenautokorrelation und der partiellen Autokorrelationsfunktionen ab. Nun, für Ihre grundlegenden Modelle, ist die Aufgabe nicht allzu schwierig. Jeder hat Autokorrelationsfunktionen, die eine bestimmte Weise aussehen. Allerdings, wenn Sie gehen in der Komplexität, die Muster sind nicht so leicht zu erkennen. Um es schwieriger zu machen, stellen Ihre Daten nur eine Probe des zugrundeliegenden Prozesses dar. Das bedeutet, dass Stichprobenfehler (Ausreißer, Messfehler etc.) den theoretischen Identifikationsprozess verzerren können. Deshalb ist die traditionelle ARIMA-Modellierung eher eine Kunst als eine Wissenschaft. Box Jenkins-Methodik Die in Analyse und Prognose eingesetzte Box-Jenkins-Methodik gilt weitgehend als die effizienteste Prognosemethode und wird ausgiebig - speziell für univariate Zeitreihen - eingesetzt. Die dreistufige Strategie der Identifikation, Schätzung und Diagnoseprüfung. Erfordert die Person, die verantwortlich ist, Prognosen zu produzieren, um Erfahrung und Wissen zu haben. Im Gegensatz zu anderen Techniken ist Box-Jenkins ein Verfahren, das ein verändertes Verhalten der Variablen verwendet, um das beste Prognosemodell aus einer allgemeinen Klasse von Modellen auszuwählen. Es geht davon aus, dass jedes Zeitreihenmuster durch eine von drei Kategorien von Modellen dargestellt werden kann. Diese Kategorien umfassen: 8226 Autoregressive Modelle: Prognosen einer Variablen basierend auf der linearen Funktion ihrer Vergangenheitswerte 8226 Moving Durchschnittliche Modelle: Prognosen basierend auf Linearkombinationen von vergangenen Fehlern 8226 Autoregressive-Moving Durchschnittliche Modelle: Kombination der beiden vorherigen Kategorien Die wichtigsten Fragen, wie viele vergangene Werte (die fokale Variable und / oder seine Fehler) sollten in das Modell aufgenommen werden. Es gibt im Wesentlichen drei Stufen zu einem Box-Jenkins-Verfahren: 1. Identifizieren des vorläufigen Modells. Welche der drei oben aufgeführten Kategorien als die entsprechende Kategorie identifiziert wird, wird bestimmt, indem zuerst die Daten stationär gemacht werden (üblicherweise durch Differenzieren der Daten) und dann die Autokorrelationen und partiellen Autokorrelationen der stationären Daten analysiert werden. Für jedes der möglichen Modelle gibt es theoretische Autokorrelation und partielle Autokorrelationsprofile. Daher ist die Bestimmung des geeigneten Modelltyps für eine spezifische Situation hauptsächlich eine Frage der Übereinstimmung der beobachteten Korrelationen mit den theoretischen Korrelationen. 2. Bestimmung der Parameter des Modells. Dies ist vergleichbar mit der Schätzung der Parameter in der Regressionsanalyse. 3. Anwendung des Modells. Vorteile: Box-Jenkins Ansätze für die Prognose bieten einige der genauesten kurzfristigen Prognosen. Einschränkungen: Es erfordert jedoch eine sehr große Menge an Daten.

No comments:

Post a Comment