Moving Average Autokovarianz




Moving Average Autokovarianz2.1 Verschieben von Durchschnittsmodellen (MA-Modelle) Zeitreihenmodelle, die als ARIMA-Modelle bekannt sind, konnen autoregressive Begriffe und / oder gleitende Durchschnittsterme enthalten. In Woche 1 erlernten wir einen autoregressiven Term in einem Zeitreihenmodell fur die Variable x t ist ein verzogerter Wert von x t. Beispielsweise ist ein autoregressiver Term der Verzogerung 1 x t-1 (multipliziert mit einem Koeffizienten). Diese Lektion definiert gleitende Durchschnittsterme. Ein gleitender Durchschnittsterm in einem Zeitreihenmodell ist ein vergangener Fehler (multipliziert mit einem Koeffizienten). Es sei n (0, sigma2w) uberschritten, was bedeutet, da? die wt identisch unabhangig voneinander verteilt sind, jeweils mit einer Normalverteilung mit dem Mittelwert 0 und der gleichen Varianz. Das durch MA (1) bezeichnete gleitende Durchschnittsmodell der 1. Ordnung ist (xt mu wt theta1w) Das durch MA (2) bezeichnete gleitende Durchschnittsmodell der zweiten Ordnung ist (xt mu wt theta1w theta2w) Das gleitende Mittelmodell der q-ten Ordnung , Mit MA (q) bezeichnet, ist (xt mu wt theta1w theta2w dots thetaqw) Hinweis. Viele Lehrbucher und Softwareprogramme definieren das Modell mit negativen Vorzeichen vor den Begriffen. Dies andert nicht die allgemeinen theoretischen Eigenschaften des Modells, obwohl es die algebraischen Zeichen der geschatzten Koeffizientenwerte und (nicht quadrierten) Ausdrucke in Formeln fur ACFs und Abweichungen umwandelt. Sie mussen Ihre Software uberprufen, um zu uberprufen, ob negative oder positive Vorzeichen verwendet worden sind, um das geschatzte Modell korrekt zu schreiben. R verwendet positive Vorzeichen in seinem zugrunde liegenden Modell, wie wir hier tun. Theoretische Eigenschaften einer Zeitreihe mit einem MA (1) Modell Beachten Sie, dass der einzige Wert ungleich Null im theoretischen ACF fur Verzogerung 1 ist. Alle anderen Autokorrelationen sind 0. Somit ist ein Proben-ACF mit einer signifikanten Autokorrelation nur bei Verzogerung 1 ein Indikator fur ein mogliches MA (1) - Modell. Fur interessierte Studierende, Beweise dieser Eigenschaften sind ein Anhang zu diesem Handout. Beispiel 1 Angenommen, dass ein MA (1) - Modell x t 10 w t .7 w t-1 ist. Wobei (wt uberstehendes N (0,1)). Somit ist der Koeffizient 1 0,7. Die theoretische ACF wird durch eine Plot dieser ACF folgt folgt. Die graphische Darstellung ist die theoretische ACF fur eine MA (1) mit 1 0,7. In der Praxis liefert eine Probe gewohnlich ein solches klares Muster. Unter Verwendung von R simulierten wir n 100 Abtastwerte unter Verwendung des Modells x t 10 w t .7 w t-1, wobei w t iid N (0,1) war. Fur diese Simulation folgt ein Zeitreihen-Diagramm der Probendaten. Wir konnen nicht viel von dieser Handlung erzahlen. Die Proben-ACF fur die simulierten Daten folgt. Wir sehen eine Spitze bei Verzogerung 1, gefolgt von im Allgemeinen nicht signifikanten Werten fur Verzogerungen nach 1. Es ist zu beachten, dass das Beispiel-ACF nicht mit dem theoretischen Muster des zugrunde liegenden MA (1) ubereinstimmt, was bedeutet, dass alle Autokorrelationen fur Verzogerungen nach 1 0 sein werden Eine andere Probe hatte eine geringfugig unterschiedliche Probe ACF wie unten gezeigt, hatte aber wahrscheinlich die gleichen breiten Merkmale. Theroretische Eigenschaften einer Zeitreihe mit einem MA (2) - Modell Fur das MA (2) - Modell sind die theoretischen Eigenschaften die folgenden: Die einzigen Werte ungleich Null im theoretischen ACF sind fur die Lags 1 und 2. Autokorrelationen fur hohere Lags sind 0 , So zeigt ein Beispiel-ACF mit signifikanten Autokorrelationen bei Lags 1 und 2, aber nicht signifikante Autokorrelationen fur hohere Lags ein mogliches MA (2) - Modell. Iid N (0,1). Die Koeffizienten betragen 1 0,5 und 2 0,3. Da es sich hierbei um ein MA (2) handelt, wird der theoretische ACF nur bei den Verzogerungen 1 und 2 Werte ungleich Null aufweisen. Werte der beiden Nicht-Autokorrelationen sind A-Plots des theoretischen ACFs. Wie fast immer der Fall ist, verhalten sich Musterdaten nicht ganz so perfekt wie die Theorie. Wir simulierten n 150 Beispielwerte fur das Modell x t 10 w t .5 w t-1 .3 w t-2. Wobei wt iid N (0,1) ist. Die Zeitreihenfolge der Daten folgt. Wie bei dem Zeitreihenplot fur die MA (1) Beispieldaten konnen Sie nicht viel davon erzahlen. Die Proben-ACF fur die simulierten Daten folgt. Das Muster ist typisch fur Situationen, in denen ein MA (2) - Modell nutzlich sein kann. Es gibt zwei statistisch signifikante Spikes bei Lags 1 und 2, gefolgt von nicht signifikanten Werten fur andere Lags. Beachten Sie, dass aufgrund des Stichprobenfehlers das Muster ACF nicht genau dem theoretischen Muster entsprach. ACF fur allgemeine MA (q) - Modelle Eine Eigenschaft von MA (q) - Modellen besteht im Allgemeinen darin, dass Autokorrelationen ungleich Null fur die ersten q-Verzogerungen und Autokorrelationen 0 fur alle Verzogerungen gt q existieren. Nicht-Eindeutigkeit der Verbindung zwischen Werten von 1 und (rho1) in MA (1) Modell. Im MA (1) - Modell fur einen Wert von 1. Die reziproke 1/1 gibt den gleichen Wert fur Als Beispiel, verwenden Sie 0.5 fur 1. Und dann 1 / (0,5) 2 fur 1 verwenden. Youll erhalten (rho1) 0,4 in beiden Fallen. Um eine theoretische Einschrankung als Invertibilitat zu befriedigen. Wir beschranken MA (1) - Modelle auf Werte mit einem Absolutwert von weniger als 1. In dem gerade angegebenen Beispiel ist 1 0,5 ein zulassiger Parameterwert, wahrend 1 1 / 0,5 2 nicht. Invertibilitat von MA-Modellen Ein MA-Modell soll invertierbar sein, wenn es algebraisch aquivalent zu einem konvergierenden unendlichen Ordnungs-AR-Modell ist. Durch Konvergenz meinen wir, dass die AR-Koeffizienten auf 0 sinken, wenn wir in der Zeit zuruckgehen. Invertibilitat ist eine Einschrankung, die in Zeitreihensoftware programmiert ist, die verwendet wird, um die Koeffizienten von Modellen mit MA-Begriffen abzuschatzen. Sein nicht etwas, das wir in der Datenanalyse uberprufen. Zusatzliche Informationen uber die Invertibilitatsbeschrankung fur MA (1) - Modelle finden Sie im Anhang. Fortgeschrittene Theorie Anmerkung. Fur ein MA (q) - Modell mit einem angegebenen ACF gibt es nur ein invertierbares Modell. Die notwendige Bedingung fur die Invertierbarkeit ist, da? die Koeffizienten solche Werte haben, da? die Gleichung 1- 1 y-. - q y q 0 hat Losungen fur y, die au?erhalb des Einheitskreises liegen. R-Code fur die Beispiele In Beispiel 1 wurde der theoretische ACF des Modells x t 10 w t aufgetragen. 7w t-1. Und dann n 150 Werte aus diesem Modell simuliert und die Abtastzeitreihen und die Abtast-ACF fur die simulierten Daten aufgetragen. Die R-Befehle, die verwendet wurden, um den theoretischen ACF aufzuzeichnen, waren: acfma1ARMAacf (mac (0,7), lag. max10) 10 Verzogerungen von ACF fur MA (1) mit theta1 0,7 lags0: 10 erzeugt eine Variable namens lags, die im Bereich von 0 bis 10 liegt (H0) fugt dem Diagramm eine horizontale Achse hinzu Der erste Befehl bestimmt den ACF und speichert ihn in einem Objekt Genannt acfma1 (unsere Wahl des Namens). Der Plotbefehl (der dritte Befehl) verlauft gegen die ACF-Werte fur die Verzogerungen 1 bis 10. Der ylab-Parameter kennzeichnet die y-Achse und der Hauptparameter einen Titel auf dem Plot. Um die Zahlenwerte der ACF zu sehen, benutzen Sie einfach den Befehl acfma1. Die Simulation und Diagramme wurden mit den folgenden Befehlen durchgefuhrt. (N150, list (mac (0.7))) Simuliert n 150 Werte aus MA (1) xxc10 addiert 10 zum Mittelwert 10. Simulationsvorgaben bedeuten 0. plot (x, typeb, mainSimulated MA (1) data) Acf (x, xlimc (1,10), mainACF fur simulierte Probendaten) In Beispiel 2 wurde der theoretische ACF des Modells xt 10 wt. 5 w t-1 .3 w t-2 aufgetragen. Und dann n 150 Werte aus diesem Modell simuliert und die Abtastzeitreihen und die Abtast-ACF fur die simulierten Daten aufgetragen. Die verwendeten R-Befehle waren acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 Plot (lags, acfma2, xlimc (1,10), ylabr, typh, main ACF fur MA (2) mit theta1 0,5, (X, x) (x, x) (x, x, x, y) (1) Fur interessierte Studierende sind hier Beweise fur die theoretischen Eigenschaften des MA (1) - Modells. Variante: (Text (xt) Text (mu wt theta1 w) 0 Text (wt) Text (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Wenn h 1 der vorhergehende Ausdruck 1 w 2. Fur irgendeinen h 2 ist der vorhergehende Ausdruck 0 Der Grund dafur ist, dass, durch Definition der Unabhangigkeit der wt. E (w k w j) 0 fur beliebige k j. Da w w die Mittelwerte 0, E (w j w j) E (w j 2) w 2 haben. Fur eine Zeitreihe, Wenden Sie dieses Ergebnis an, um den oben angegebenen ACF zu erhalten. Ein invertierbares MA-Modell ist eines, das als unendliches Ordnungs-AR-Modell geschrieben werden kann, das konvergiert, so da? die AR-Koeffizienten gegen 0 konvergieren, wenn wir unendlich zuruck in der Zeit bewegen. Gut zeigen Invertibilitat fur die MA (1) - Modell. Dann setzen wir die Beziehung (2) fur wt-1 in Gleichung (1) (3) ein (zt wt theta1 (z-therma1w) wt theta1z - theta2w) Zum Zeitpunkt t-2. Gleichung (2) wird dann in Gleichung (3) die Gleichung (4) fur wt-2 ersetzen (zt wt theta1 z - theta21w wt theta1z - theta21 (z - theta1w) wt theta1z - theta12z theta31w) Unendlich), erhalten wir das unendliche Ordnungsmodell (zt wt theta1 z - theta21z theta31z - theta41z Punkte) Beachten Sie jedoch, dass bei 1 1 die Koeffizienten, die die Verzogerungen von z vervielfachen (unendlich) in der Gro?e zunehmen, Zeit. Um dies zu verhindern, benotigen wir 1 lt1. Dies ist die Bedingung fur ein invertierbares MA (1) - Modell. Unendlich Ordnung MA Modell In Woche 3, gut sehen, dass ein AR (1) Modell in ein unendliches order MA Modell umgewandelt werden kann: (xt - mu wt phi1w phi21w Punkte phik1 w Punkte sum phij1w) Diese Summation der Vergangenheit wei?er Rauschbegriffe ist bekannt Als die kausale Darstellung eines AR (1). Mit anderen Worten, x t ist eine spezielle Art von MA mit einer unendlichen Anzahl von Begriffen, die in der Zeit zuruckgehen. Dies wird als unendliche Ordnung MA oder MA () bezeichnet. Eine endliche Ordnung MA ist eine unendliche Ordnung AR und jede endliche Ordnung AR ist eine unendliche Ordnung MA. Ruckruf in Woche 1, stellten wir fest, dass eine Anforderung fur eine stationare AR (1) ist, dass 1 lt1. Berechnen Sie die Var (x t) mit der kausalen Darstellung. Dieser letzte Schritt verwendet eine Grundtatsache uber geometrische Reihen, die (phi1lt1) erforderlich sind, ansonsten divergiert die Reihe. NavigationPurpose: Check Randomness Autokorrelationsdiagramme (Box und Jenkins, S. 28-32) sind ein gangiges Werkzeug zur Uberprufung der Zufalligkeit in einem Datensatz. Diese Zufalligkeit wird durch Berechnen von Autokorrelationen fur Datenwerte bei variierenden Zeitverzogerungen ermittelt. Wenn sie zufallig sind, sollten solche Autokorrelationen nahezu null fur irgendwelche und alle zeitlichen Verzogerungen sein. Wenn nicht-zufallig, dann werden eine oder mehrere der Autokorrelationen signifikant ungleich Null sein. Daruber hinaus werden Autokorrelationsdiagramme in der Modellidentifikationsstufe fur autoregressive, gleitende mittlere Zeitreihenmodelle von Box-Jenkins verwendet. Autokorrelation ist nur ein Ma? der Zufalligkeit Beachten Sie, dass unkorreliert nicht unbedingt zufallig bedeutet. Daten mit signifikanter Autokorrelation sind nicht zufallig. Daten, die keine signifikante Autokorrelation aufweisen, konnen jedoch auf andere Weise noch nicht-zufallig auftreten. Autokorrelation ist nur ein Ma? der Zufalligkeit. Im Rahmen der Modellvalidierung (die der primare Typ der Zufalligkeit ist, die wir im Handbuch behandeln) ist die Uberprufung auf Autokorrelation typischerweise ein ausreichender Test der Zufalligkeit, da die Residuen von schlechten Anpassungsmodellen dazu tendieren, nicht-subtile Zufalligkeit zu zeigen. Einige Anwendungen erfordern jedoch eine strengere Bestimmung der Zufalligkeit. In diesen Fallen wird eine Batterie von Tests, die eine Uberprufung auf Autokorrelation einschlie?en kann, angewandt, da Daten in vielen verschiedenen und oft subtilen Arten nicht-zufallig sein konnen. Ein Beispiel dafur, wo eine strengere Uberprufung der Zufalligkeit erforderlich ist, ware das Testen von Zufallszahlengeneratoren. Beispiel-Diagramm: Autokorrelationen sollten nahe-Null fur die Zufalligkeit sein. Dies ist bei diesem Beispiel nicht der Fall, so dass die Zufallsannahme fehlschlagt. Dieses Beispiel-Autokorrelationsdiagramm zeigt, dass die Zeitreihe nicht zufallig ist, sondern vielmehr einen hohen Grad an Autokorrelation zwischen benachbarten und nahe benachbarten Beobachtungen aufweist. Definition: r (h) versus h Autokorrelationsdiagramme werden durch vertikale Achse gebildet: Autokorrelationskoeffizient, wobei C h die Autokovarianzfunktion ist und C 0 die Varianzfunktion ist. Beachten Sie, dass R h zwischen -1 und 1 liegt Folgende Formel fur die Autokovarianz-Funktion Obwohl diese Definition weniger Vorspannung hat, hat die (1 / N) - Formulierung einige wunschenswerte statistische Eigenschaften und ist die am haufigsten in der Statistikliteratur verwendete Form. Siehe Seiten 20 und 49-50 in Chatfield fur Details. Horizontale Achse: Zeitverzogerung h (h 1, 2, 3.) Die obige Zeile enthalt auch mehrere horizontale Bezugslinien. Die Mittellinie ist auf Null. Die anderen vier Zeilen sind 95 und 99 Konfidenzbander. Beachten Sie, dass es zwei verschiedene Formeln fur die Erzeugung der Vertrauensbander gibt. Wenn das Autokorrelationsdiagramm verwendet wird, um auf Zufalligkeit zu testen (dh es gibt keine Zeitabhangigkeit in den Daten), wird die folgende Formel empfohlen: wobei N die Stichprobengro?e ist, z die kumulative Verteilungsfunktion der Standardnormalverteilung und (alpha ) Ist das Signifikanzniveau. In diesem Fall haben die Vertrauensbander eine feste Breite, die von der Probengro?e abhangt. Dies ist die Formel, die verwendet wurde, um die Vertrauensbander im obigen Diagramm zu erzeugen. Autokorrelationsdiagramme werden auch in der Modellidentifikationsstufe fur die Montage von ARIMA-Modellen verwendet. In diesem Fall wird fur die Daten ein gleitendes Durchschnittsmodell angenommen und die folgenden Konfidenzbander erzeugt: wobei k die Verzogerung, N die Stichprobengro?e, z die kumulative Verteilungsfunktion der Standardnormalverteilung und (alpha) ist Das Signifikanzniveau. In diesem Fall nehmen die Vertrauensbander zu, wenn die Verzogerung zunimmt. Das Autokorrelationsdiagramm kann Antworten auf die folgenden Fragen liefern: Sind die Daten zufallig Ist eine Beobachtung, die sich auf eine angrenzende Beobachtung bezieht, ist eine Beobachtung, die mit einer zweimal entfernten Beobachtung zusammenhangt (usw.) Ist die beobachtete Zeitreihe wei?es Rauschen Ist die beobachtete Zeitreihe sinusformig Ist die beobachtete Zeitreihe autoregressiv Was ist ein geeignetes Modell fur die beobachtete Zeitreihe Ist das Modell gultig und ausreichend Ist die Formel ss / sqrt gultig Bedeutung: Sicherstellung der Gultigkeit der technischen Ergebnisse Randomness (zusammen mit festem Modell, fester Variation und fester Verteilung) Ist eine der vier Annahmen, die typischerweise allen Messprozessen zugrunde liegen. Die Zufallsannahme ist aus den folgenden drei Grunden von entscheidender Bedeutung: Die meisten standardma?igen statistischen Tests hangen von der Zufalligkeit ab. Die Gultigkeit der Testresultate steht in direktem Zusammenhang mit der Gultigkeit der Zufallsannahme. Viele haufig verwendete statistische Formeln hangen von der Zufallsannahme ab, wobei die haufigste Formel die Formel zur Bestimmung der Standardabweichung des Stichprobenmittels ist: wobei s die Standardabweichung der Daten ist. Obwohl stark verwendet, sind die Ergebnisse aus der Verwendung dieser Formel ohne Wert, es sei denn, die Zufalligkeitsannahme gilt. Fur univariate Daten ist das Standardmodell Wenn die Daten nicht zufallig sind, ist dieses Modell falsch und ungultig, und die Schatzungen fur die Parameter (wie die Konstante) werden unsinnig und ungultig. Kurz, wenn der Analytiker nicht auf Zufalligkeit pruft, dann wird die Gultigkeit vieler statistischer Schlusse verdachtig. Das Autokorrelationsdiagramm ist eine hervorragende Moglichkeit, auf solche Zufalligkeit zu prufen.