Saturday 16 December 2017

Autoregresywno ruchome przeciętne serie


Istnieje szereg podejść do modelowania szeregów czasowych. Poniżej przedstawiamy kilka najpopularniejszych metod. Trend, sezonowy, dekompozycja resztkowa Jednym ze sposobów jest rozkład wielu serii czasowych na trend, składnik sezonowy i resztkowy. Przykładem takiego podejścia jest wyrównywanie potrójnie wykładnicze. Inny przykład, zwany sezonowym lessem, oparty jest na lokalnie ważonych najmniejszych kwadratach i jest omawiany przez Cleveland (1993). W niniejszym podręczniku nie omawiamy sezonowości lessowej. Metody oparte na częstotliwościach Innym podejściem, powszechnie stosowanym w zastosowaniach naukowych i inżynierskich jest analiza serii w dziedzinie częstotliwości. Przykład tego podejścia w modelowaniu zbioru danych typu sinusoidalnego jest przedstawiony w badaniu przypadku odchylenia wiązki. Wykres spektralny jest podstawowym narzędziem do analizy częstotliwości serii czasowych. Modele autoregresywne (AR) Jednym ze sposobów modelowania jednowymiarowych serii czasowych jest autoregresywny model (AR): Xt delta phi1 X phi2 X cdots phip X At, gdzie (Xt) jest szeregiem czasów, (At) jest białym szumem, a delta lewy (1 - suma p phii po prawej) mu z (mu) oznaczając średnią procesu. Model autoregresyjny jest po prostu regresją liniową bieżącej wartości serii względem jednej lub więcej poprzednich wartości serii. Wartość (p) nazywa się kolejnością modelu AR. Modele AR można analizować za pomocą jednej z różnych metod, w tym standardowych technik liniowych najmniejszych kwadratów. Mają także prostą interpretację. Modele średnich ruchów (ang. Moving Average - MA) Inne popularne podejście do modelowania jednowymiarowych modeli szeregów czasowych jest modelem średniej ruchomej (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A, gdzie (Xt) jest szeregiem czasowym (mu ) jest średnią serii, (A) są białymi warunkami hałasu i (theta1,, ldots,, thetaq) są parametrami modelu. Wartość (q) nazywana jest kolejnością modelu MA. Oznacza to, że model średniej ruchomości jest konceptualnie regresją liniową bieżącej wartości szeregu przed białym szumem lub przypadkowymi wstrząsami jednej lub więcej poprzednich wartości szeregu. Przyjmuje się, że przypadkowe wstrząsy w każdym punkcie pochodzą z tego samego rozkładu, zwykle rozkładu normalnego, z położeniem przy zerze i stałej skali. Rozróżnienie w tym modelu polega na tym, że te przypadkowe wstrząsy są przesunięte na przyszłe wartości serii czasowej. Dopasowanie oszacowań MA jest bardziej skomplikowane niż w przypadku modeli AR, ponieważ nie można obserwować błędów. Oznacza to, że w miejsce liniowych najmniejszych kwadratów należy używać iteracyjnych nieliniowych procedur montażu. Modele MA mają również mniej oczywistą interpretację niż modele AR. Czasami ACF i PACF sugerują, że model MA byłby lepszym wyborem modelu, a czasami zarówno AR, jak i MA powinny być użyte w tym samym modelu (patrz punkt 6.4.4.5). Należy jednak pamiętać, że po zdefiniowaniu modelu warunek błędu powinien być niezależny i być zgodny ze standardowymi założeniami dla procesu jednoznacznego. Box i Jenkins popularyzowali podejście, które łączy średnią ruchomą i podejście autoregresywne w książce Analiza serii czasu: Prognozowanie i kontrola (Box, Jenkins i Reinsel, 1994). Chociaż zarówno podejście autoregresywne, jak i ruchome było już znane (i zostały pierwotnie przeanalizowane przez Yule), wkład Box i Jenkins w opracowywaniu systematycznej metodologii identyfikacji i oszacowania modeli, które mogłyby obejmować oba podejścia. To sprawia, że ​​modele Box-Jenkins są potężną klasą modeli. Następne kilka sekcji omówi te modele szczegółowo. Średnia średnia ruchoma ARMA (p, q) Modele do analizy serii czasowej - część 3 Jest to trzeci i ostatni post w mini serii na modelach ARMA (Autoregressive Moving Average) na czas analiza serii. W poprzednich artykułach przedstawiliśmy modele autoregresji i modele Moving Average. Teraz nadszedł czas na połączenie ich w celu stworzenia bardziej wyrafinowanego modelu. Ostatecznie doprowadzi to do modeli ARIMA i GARCH, które umożliwią nam przewidywanie zwrotu aktywów i prognozy zmienności. Modele te będą stanowiły podstawę sygnałów handlowych i technik zarządzania ryzykiem. Jeśli przeczytałeś część 1 i 2, zobaczysz, że mamy tendencję do śledzenia wzoru do analizy modelu serii czasowej. Powtórz to krótko tutaj: Uzasadnienie - Dlaczego jesteśmy zainteresowani tym konkretnym modelem Definicja - definicja matematyczna w celu zmniejszenia dwuznaczności. Correlogram - Wykreślenie próbki korelgramu w celu wizualizacji zachowania modelu. Symulacja i dopasowanie - dopasowanie modelu do symulacji, w celu zapewnienia prawidłowego zrozumienia modelu. Prawdziwe dane finansowe - zastosuj model do rzeczywistych cen aktywów historycznych. Przewidywanie - prognozuj kolejne wartości do budowy sygnałów handlowych lub filtrów. Aby śledzić ten artykuł, warto zapoznać się z wcześniejszymi artykułami dotyczącymi analizy serii czasowych. Mogą się tu znaleźć. Kryterium informacyjne Bayesian W części 1 tego artykułu omówiliśmy Kryterium Informacyjne Akaike (Akaike Information Criterion - AICACA) w celu pomagania nam wybrać między osobnymi modelami najlepszych serii czasowych. Ścisłym narzędziem jest kryterium informacji bajeskiej (ang. Bayesian Information Criterion - BIC). Zasadniczo ma podobne zachowanie do AIC w tym, że penalizuje modele za zbyt wiele parametrów. Może to prowadzić do nadmiernego zużycia. Różnica między BIC a AIC polega na tym, że BIC jest bardziej rygorystyczny, a jego karanie dodatkowych parametrów. Kryterium informacji Bayesiego Jeśli przyjmiemy funkcję prawdopodobieństwa dla modelu statystycznego, który ma k parametry, a L zmaksymalizuje prawdopodobieństwo. to Bayesian Information Criterion podaje: Gdzie n jest liczbą punktów danych w serii czasowej. Będziemy używać AIC i BIC poniżej przy wyborze odpowiednich modeli ARMA (p, q). Test Ljung-Box W części 1 tego artykułu seria Rajan wspomniała w komentarzu Disqus, że test Ljung-Box był bardziej odpowiedni niż użycie Kryterium Informacyjnego Akaike Kryterium Informacyjnego Bayesian w celu określenia, czy model ARMA był dobry do epoki seria. Test Ljung-Box jest klasycznym testem hipotezowym, który ma na celu zbadanie, czy zestaw autokorelacji dopasowanego modelu serii czasowej różni się istotnie od zera. Test nie testuje każdego przypadkowego opóźnienia losowego, ale raczej testuje losowość w grupie opóźnień. Badanie Ljung-Box Zdefiniujmy hipotezę zerową jako: Dane z serii czasowej w każdym opóźnieniu to i. i.d. Oznacza to, że korelacje pomiędzy wartościami serii populacji są zerowe. Zdefiniujmy alternatywną hipotezę: Dane z serii czasowych nie są i. i.d. i posiadają korelację szeregową. Obliczamy następującą statystykę testową. P: Gdzie n jest długością próbki serii czasowej, kapelusz k jest autokorelacją próbki w punkcie lag k, a h jest liczbą opóźnień w teście. Zasadą decyzyjną dotyczącą odrzucenia hipotezy zerowej jest sprawdzenie, czy Q gt chi2, dla rozkładu chi-kwadratowego z h stopniami swobody w 100 (1-alfa) th percentile. Chociaż szczegóły testu mogą wydawać się nieco skomplikowane, w rzeczywistości możemy użyć R, aby obliczyć test dla nas, upraszczając procedurę nieco. Średnia przemieszczania się z autogryzją (ARMA) Modele porządku p, q Teraz, gdy dyskutowaliśmy na temat BIC i testu Ljung-Box, byliśmy gotowi omówić nasz pierwszy model mieszany, a mianowicie Średnia ruchów autoregresji rzędu p, q lub ARMA (p, q). Do tej pory rozważaliśmy procesy autoregresji i przenoszenie średnich procesów. Poprzedni model traktuje własne zachowania w przeszłości jako dane wejściowe do modelu i jako takie próby przechwytywania efektów uczestnictwa w rynku, takich jak pęd i średni zwrotność w obrocie giełdowym. Ten ostatni model jest wykorzystywany do scharakteryzowania informacji szokowych w szeregu, takich jak ogłoszenie o zarabianiu niespodzianek lub niespodziewane zdarzenie (np. Wyciek oleju BP Deepwater Horizon). W związku z tym model ARiMR próbuje uchwycić oba te aspekty podczas modelowania serii czasowych finansowych. Zauważ, że model ARMA nie uwzględnia klastrowania zmienności, kluczowego zjawiska empirycznego wielu finansowych serii czasowych. Nie jest to model warunkujący heteroseksualność. W tym celu musimy poczekać na modele ARCH i GARCH. Definicja Model ARMA (p, q) jest liniową kombinacją dwóch modeli liniowych, a zatem jest ciągle liniowy: Autoregresywny Średnia ruchoma Model wzoru p, q Model szeregowy czasowy, jest autoregresywnym średnim ruchem modelu rzędu p, q . ARMA (p, q), jeśli: begin xt alpha1 x alpha2 x ldots wt beta1 w beta2 w ldots betaq w end Gdzie jest biały hałas z E (wt) 0 i sigma2 wariancji. Jeśli weźmiemy pod uwagę Operatora Przesuwania Wstecznego. (patrz poprzedni artykuł), możemy następnie przepisać powyższe jako funkcję theta i phi: Z łatwością możemy zauważyć, że poprzez ustawienie p neq 0 i q0 odzyskamy model AR (p). Podobnie, jeśli ustawimy p 0 i q neq 0, odzyskamy model MA (q). Jedną z kluczowych cech modelu ARiM jest fakt, że w parametrach jest oszczędny i zbędny. Oznacza to, że model ARMA często wymaga mniej parametrów niż sam model AR (p) lub MA (q). Ponadto, jeśli przepisujemy równanie w kontekście BSO, to wielomiany teta i phi mogą czasami mieć wspólny współczynnik, co prowadzi do prostszego modelu. Symulacje i korelogramy Podobnie jak w przypadku autoregresji i przeciętnych modeli, będziemy symulować różne serie ARMA, a następnie próbować dopasować modele ARMA do tych realizacji. Wykonujemy to dlatego, że chcemy zapewnić, że zrozumiemy procedurę dopasowania, w tym sposób obliczania przedziałów ufności dla modeli, a także zapewnić, że procedura rzeczywiście odzyskuje uzasadnione szacunki dla oryginalnych parametrów ARMA. W części 1 i 2 ręcznie skonstruowaliśmy serię AR i MA, narysując N próbek z rozkładu normalnego, a następnie opracowano specyficzny model szeregów czasowych przy użyciu opóźnień w tych próbkach. Istnieje jednak prostszy sposób na symulowanie danych AR, MA, ARMA, a nawet ARIMA, po prostu przy użyciu metody arima. sim w R. Pozwala rozpocząć od najprostszego możliwego nietrywialnego modelu ARiMR, a mianowicie ARiMR (1,1 ) Model. Oznacza to, że autoregresywny model porządku jeden w połączeniu z ruchomym średnim modelem kolejności. Taki model ma tylko dwie współczynniki, alfa i beta, które reprezentują pierwsze opóźnienia samego szeregu czasowego i szok białego szumu. Taki model jest określony przez: Przed symulacją musimy określić współczynniki. Przyjmijmy alpha 0.5 i beta -0.5: Wyjście jest następujące: Pozwala także wykreślić koreklogram: widać, że nie ma znaczącej autokorelacji, którą należy spodziewać się z modelu ARMA (1,1). Na koniec spróbuj obliczyć współczynniki i ich standardowe błędy za pomocą funkcji arima: możemy obliczyć przedziały ufności dla każdego parametru za pomocą standardowych błędów: przedziały ufności zawierają prawdziwe wartości parametrów dla obu przypadków, ale należy zauważyć, że 95 przedziały ufności są bardzo szerokie (wynika to z dość dużych błędów standardowych). Pozwala teraz wypróbować model ARMA (2,2). Oznacza to model AR (2) połączony z modelem MA (2). Musimy określić cztery parametry tego modelu: alfa1, alfa2, beta1 i beta2. Pozwala zabrać alpha1 0.5, alpha2-0.25 beta10.5 i beta2-0.3: Wyjście naszego modelu ARMA (2,2) wygląda następująco: A odpowiadająca im autokorelacja: teraz możemy spróbować dopasować model ARMA (2,2) do dane: Możemy również obliczyć przedziały ufności dla każdego parametru: Zauważ, że przedziały ufności dla współczynników dla ruchomych składników średniej (beta1 i beta2) w rzeczywistości nie zawierają pierwotnej wartości parametru. Wskazuje to na niebezpieczeństwo próby dostosowania modeli do danych nawet wtedy, gdy znamy prawdziwe wartości parametrów. Jednak w celach handlowych potrzebujemy tylko siły predykcyjnej, która przekracza szansę i wytworzy wystarczająco dużo zysków powyżej kosztów transakcji, aby zyskać na zyskach długi bieg. Teraz, gdy widzimy kilka przykładów symulowanych modeli ARMA, potrzebujemy mechanizmu wyboru wartości p i q przy dopasowywaniu modeli do rzeczywistych danych finansowych. Wybór najlepszego modelu ARMA (p, q) Aby określić, która kolejność p, q modelu ARMA jest odpowiednia dla szeregu, musimy użyć AIC (lub BIC) w podzbiorze wartości dla p, q i a następnie zastosuj test Ljung-Box, aby ustalić, czy zostało osiągnięte dobre dopasowanie, dla konkretnych wartości p, q. Aby pokazać tę metodę, najpierw będziemy symulować konkretny proces ARMA (p, q). Będziemy wtedy pętli wszystkie pary wartości p in i q in i obliczyć AIC. Wybieramy model z najniższym AIC, a następnie test Ljung-Box na resztkach, aby ustalić, czy osiągnęliśmy dobre wyniki. Zacznijmy od symulacji serii ARMA (3,2): teraz utworzymy obiekt, który pozwoli zachować najlepsze dopasowanie modelu i najniższą wartość AIC. Pętlę nad różnymi kombinacjami p, q i używamy bieżącego obiektu do przechowywania dopasowania modelu ARMA (i, j) dla zmiennych pętli i i j. Jeśli bieżący AIC jest mniejszy niż jakikolwiek wcześniej wyliczony AIC, ustawiamy końcowy AIC na tę bieżącą wartość i wybierz tę kolejność. Po zakończeniu pętli mamy kolejność modelu ARMA przechowywanego w final. order i ARIMA (p, d, q) dopasowują się (ze zintegrowanym składnikiem d ustawionym na 0) przechowywanej jako final. arma: Pozwala wyprowadzić AIC , rzędu i współczynników ARIMA: widać, że pierwotny porządek symulowanego modelu ARMA został odzyskany, a mianowicie z p3 i q2. Możemy sprecyzować corelogram pozostałości modelu, aby zobaczyć, czy wyglądają na realizację dyskretnego białego szumu (DWN): Corelogram rzeczywiście wygląda jak realizacja DWN. Wreszcie, wykonujemy test Ljung-Box na 20 opóźnień, aby to potwierdzić: Zauważ, że wartość p jest większa niż 0,05, co oznacza, że ​​reszty są niezależne na poziomie 95, a zatem model ARMA (3,2) zapewnia dobre dopasowanie modelu. Oczywiście tak powinno być w przypadku, gdy sam skomentowaliśmy dane. Jednak właśnie ta procedura zostanie użyta, gdy dopasujemy modele ARMA (p, q) do indeksu SampP500 w następnej sekcji. Dane finansowe Teraz, gdy przedstawiliśmy procedurę wyboru optymalnego modelu szeregowego dla serii symulowanych, stosujemy je do danych finansowych. W tym przykładzie po raz kolejny wybieramy SampP500 US Equity Index. Pozwala na pobieranie dziennych cen zamknięcia przy użyciu quantmod, a następnie utworzenie strumienia powrotnego: umożliwia wykonanie tej samej procedury dopasowania jak w symulowanych seriach ARMA (3,2) powyżej w dzienniku zwraca serie SampP500 przy użyciu modelu AIC: najlepszy model dopasowania ma zlecenie ARMA (3,3): Pozwala wyznaczyć resztki dopasowanego modelu do codziennego strumienia danych dziennika SampP500: Zauważ, że istnieją znaczne piki, zwłaszcza przy wyższych opóźnieniach. To wskazuje na słabe dopasowanie. Pozwala przeprowadzić test Ljung-Box, aby sprawdzić, czy mamy statystyczne dowody na to: jak podejrzewaliśmy, wartość p jest mniejsza niż 0,05 i jako taka nie możemy powiedzieć, że resztki są realizacją dyskretnego białego szumu. Stąd istnieje dodatkowa autokorelacja w resztach, której nie wyjaśniono w modelu ARMA (3,3). Następne etapy Jak omawialiśmy cały czas w tej serii artykułów, zobaczyliśmy dowody warunkowej heteroskompresji (klasteryzacja lotności) w serii SampP500, zwłaszcza w okresach około 2007-2008. Kiedy w serii artykułów użyjemy modelu GARCH, zobaczymy, jak wyeliminować te autokorelacje. W praktyce modele ARMA nigdy nie są właściwie przystosowane do zwrotu papierów wartościowych. Musimy wziąć pod uwagę warunkową heteroskompresję i używać kombinacji ARIMA i GARCH. Następny artykuł będzie rozpatrywać ARIMA i pokazać, jak zintegrowany składnik różni się od modelu ARMA, który rozważaliśmy w tym artykule. Tylko początek handlu ilościami.8.3 Modele autoregresji W modelu regresji wielorakiej prognozujemy zmienną zainteresowania przy użyciu liniowej kombinacji predykcyjnych. W modelu autoregresji prognozujemy zmienną odsetkową przy użyciu kombinacji liniowej przeszłych wartości zmiennej. Termin regresja automatyczna wskazuje, że jest to regresja zmiennej przeciwko sobie. Zatem autoregresywny model porządku p można zapisać, gdy c oznacza stały i et biały szum. To jest jak regresja wielokrotna, ale z opóźnionymi wartościami yt jako predykatami. Odnoszę się do tego jako model AR (p). Modele autoregresyjne są niezwykle elastyczne w obsłudze wielu różnych wzorców serii czasowych. Na rysunku 8.5 przedstawiono dwie serie z modelu AR (1) i modelu AR (2). Zmiana parametrów phi1, kropek, wyników fip w różnych wzorcach szeregów czasowych. Odchylenie terminu błędów et zmieni tylko skalę serii, a nie wzorce. Rysunek 8.5: Dwa przykłady danych z modeli autoregresji o różnych parametrach. Lewo: AR (1) z yt 18 -0.8y et. Po prawej: AR (2) z yt 8 ​​1.3y -0.7y et. W obu przypadkach, normalnie rozprowadzany jest biały szum o średniej zerowej i wariancji. W przypadku modelu AR (1): Gdy phi10, yt odpowiada białemu szumowi. Kiedy phi11 i c0, yt jest równoznaczne z losowym chodem. Kiedy phi11 i cne0, yt jest równoznaczne z przypadkowym chodem z dryftem Gdy phi1lt0, yt ma tendencję do oscylowania między wartościami dodatnimi i ujemnymi. Zwykle ograniczamy modele autoregresji do stacjonarnych danych, a następnie pewne ograniczenia wartości parametrów są wymagane. Dla modelu AR (1): -1 lt phi1 lt 1. Dla modelu AR (2): -1 lt phi2 lt1, phi1phi2 lt 1, phi2-phi1 lt 1. Gdy pge3 ograniczenia są znacznie bardziej skomplikowane. R uwzględnia te ograniczenia podczas szacowania modelu.2.1 Ruchome modele średnie (modele MA) Modele serii czasowej znane jako modele ARIMA mogą obejmować pojęcia autoregresyjne i średnie ruchome. W pierwszym tygodniu dowiedzieliśmy się, że termin autoregresji w modelu szeregów czasowych dla zmiennej x t jest opóźnioną wartością x t. Na przykład terminem autoregresji 1 opóźnienia jest x t-1 (pomnożony przez współczynnik). Ta lekcja definiuje ruchome średnie terminy. Ruchoma średnia wersja w modelu szeregów czasowych jest błędem w przeszłości pomnożonym przez współczynnik. Niech (przewyższa N (0, sigma2w)), co oznacza, że ​​w t są identycznie, niezależnie rozdzielane, każdy z normalnym rozkładem mającym średnią 0 i tę samą wariancję. Średni model średniej ruchomej, oznaczony symbolem MA (1) to (xt mu wt atta1w) Średni model ruchu średniego rzędu, oznaczony symbolem MA (2) to (xt mu wt atta1w theta2w) , oznaczone literą MA (q) jest (xt mu wt theta2w kropka thetaqw) Uwaga. Wiele podręczników i programów definiuje model z negatywnymi znakami przed terminami. To nie zmienia ogólnych teoretycznych właściwości modelu, chociaż odwraca znaki algebraiczne oszacowanych wartości współczynników i (niezakłóconych) w formułach ACF i wariancji. Musisz sprawdzić oprogramowanie w celu sprawdzenia, czy użyto negatywnych lub pozytywnych oznaczeń w celu poprawnego zapisania szacowanego modelu. R używa pozytywnych oznaczeń w swoim modelu bazowym, tak jak tutaj. Właściwości teoretyczne serii czasowej z modelem MA (1) Należy pamiętać, że jedyną niższą wartością w teoretycznym ACF jest opóźnienie 1. Wszystkie inne autokorelacje wynoszą 0. Tak więc próbka ACF o znacznej autokorelacji tylko w punkcie 1 jest wskaźnikiem możliwego modelu MA (1). Dla zainteresowanych studentów, dowody dotyczące tych właściwości stanowią załącznik do niniejszego materiału informacyjnego. Przykład 1 Załóżmy, że model MA (1) wynosi x t 10 w t .7 w t-1. gdzie (nadwrażliwość N (0,1)). Współczynnik 1 0,7. Teoretyczny ACF podano w poniższym wykresie ACF. Przedstawiona fabuła jest teoretycznym ACF dla MA (1) z 1 0,7. W praktyce próbka zazwyczaj nie dostarcza tak wyraźnego wzorca. Używając R, symulujemy 100 wartości próbek przy użyciu modelu x t 10 w t .7 w t-1, gdzie w t iid N (0,1). W tej symulacji powstaje ciąg szeregowy danych przykładowych. Nie możemy wiele powiedzieć z tej fabuły. Poniżej znajduje się próbka ACF dla danych symulowanych. Widzimy skok w punkcie 1, a następnie ogólnie wartości nieistotne dla opóźnień 1. Pamiętaj, że próbka ACF nie jest zgodna z teoretycznym wzorem MA (1) leżącego u podstawy, co oznacza, że ​​wszystkie autokorelacje w przypadku opóźnień 1 będą 0 Inna próbka miałaby nieco inną próbkę ACF pokazaną poniżej, ale najprawdopodobniej miałyby takie same cechy. Właściwości terapeutyczne serii czasowej z modelem MA (2) Dla modelu MA (2), właściwości teoretyczne są następujące: Należy zauważyć, że jedynymi wartościami niezonarnymi w teoretycznym ACF są opóźnienia 1 i 2. Autokorelacje dla wyższych opóźnień to 0 Więc próba ACF o znacznych autokorelacjach w przypadku opóźnień 1 i 2, ale nieistotne autokorelacje dla wyższych opóźnień wskazują na możliwy model MA (2). iid N (0,1). Współczynniki wynoszą 1 0,5 i 2 0,3. Ponieważ jest to MA (2), teoretyczny ACF będzie miał wartości inne niż z opóźnieniami 1 i 2. Wartości dwóch niezerowych autokorelacji to wykres A teoretycznej ACF. Jak prawie zawsze jest tak, dane próbki nie zachowują się tak doskonale jak teoria. Symulujemy n 150 wartości próbek dla modelu x t 10 w t .5 w t-1 .3 w t-2. gdzie w t iid N (0,1). Sporządza się szeregowy szereg danych. Podobnie jak w przypadku szeregów czasowych dla danych próbki MA (1), niewiele można powiedzieć o tym. Poniżej znajduje się próbka ACF dla danych symulowanych. Wzór jest typowy dla sytuacji, gdy model MA (2) może być użyteczny. Istnieją dwa statystycznie istotne skoki przy opóźnieniach 1 i 2, po których następują nieistotne wartości dla innych opóźnień. Zauważ, że z powodu błędu pobierania próbek próbka ACF nie pasowała dokładnie do teoretycznego wzoru. ACF dla modeli MA (q) Modeli Ogólną cechą modeli MA (q) jest to, że dla wszystkich pierwszych opóźnień q i autokorelacji 0 dla wszystkich luków gtq istnieją autokorelacje nie zerowe. Niepowtarzalność połączenia pomiędzy wartościami 1 i (rho1) w modelu MA (1). W modelu MA (1) dla dowolnej wartości 1. odwrotny 1 1 daje taką samą wartość jak dla przykładu, użyj 0,5 dla 1. a następnie użyj 1 (0.5) 2 dla 1. Otrzymasz (rho1) 0,4 w obu przypadkach. Aby zaspokoić teoretyczne ograniczenie zwane "invertibility". ograniczamy modele MA (1) do wartości z wartością bezwzględną mniejszą niż 1. W podanym przykładzie, 1 0,5 będzie dopuszczalną wartością parametru, podczas gdy 1 10,5 2 nie będzie. Odwrotność modeli MA Model macierzowy jest odwracalny, jeśli jest on algebraiczny, odpowiadający modelowi zbiegającemu się z nieskończonym modelem AR. Zbiegając się, rozumiemy, że współczynniki AR spadają do 0, gdy wracamy w czasie. Inwersja to ograniczenie zaprogramowane w oprogramowanie serii czasowej służące do oszacowania współczynników modeli z hasłami. To nie coś, co sprawdzamy w analizie danych. Dodatkowe informacje o ograniczeniu inwersji dla modeli MA (1) podano w dodatku. Uwagi dotyczące teorii zaawansowanej. W modelu MA (q) z określonym ACF jest tylko jeden model odwracalny. Warunkiem koniecznym do odwrócenia jest fakt, że współczynniki mają takie wartości, że równanie 1- 1 y-. - q y q 0 ma rozwiązania dla y, które leżą poza okręgiem jednostkowym. R dla przykładów W przykładzie 1 wykreślono teoretyczny ACF modelu x t 10 w t. 7w t-1. a następnie symulowane n 150 wartości z tego modelu i wykreślono szereg próbkowania i próbkę ACF dla danych symulowanych. Polecenia R służące do sporządzenia teoretycznej ACF to: acfma1ARMAacf (mac (0.7), lag. max10) 10 opóźnień ACF dla MA (1) z theta1 0,7 lags0: 10 tworzy zmienną o nazwie opóźnienia w zakresie od 0 do 10 (h0) dodaje osi poziomej do wykresu Pierwsze polecenie określa ACF i zapisuje je w obiekcie (np. o nazwie acfma1 (nasz wybór nazwy). Polecenie wydruku (trzecie polecenie) powoduje błędy w porównaniu do wartości ACF dla opóźnień 1 do 10. Parametr ylab etykietuje na osi y, a główny parametr umieszcza tytuł na wykresie. Aby zobaczyć wartości liczbowe ACF, użyj komendy acfma1. Symulacje i wykresy zostały wykonane za pomocą następujących poleceń. xcarc. sim (n150, lista (mac (0.7))) Symuluje n 150 wartości z MA (1) xxc10 dodaje 10 do średniej 10. Domyślnie domyślne symulacje to 0. wykres (x, typeb, mainSimulated MA (1) data) acf (x, xlimc (1,10), mainACF dla symulowanych danych próbki) W przykładzie 2 wymyśliliśmy teoretyczny ACF modelu xt 10 wt5 w t-1 .3 w t-2. a następnie symulowane n 150 wartości z tego modelu i wykreślono szereg próbkowania i próbkę ACF dla danych symulowanych. Stosowane komendy R to acfma2ARMAacf (mac (0.5.0.3), lag. max10) acfma2 lags0: 10 (lags, acfma2, xlimc (1,10), ylabr, typh, główny ACF dla MA (2) z theta1 0,5, (x, x, x, x, x, x, x, x, x, x, x, x, y) mainACF dla symulowanych danych MA (2)) Dodatek: Dowód właściwości MA (1) Dla zainteresowanych studentów są dowody na teoretyczne właściwości modelu MA (1). Variance: (text (xt) text (mu wt theta1 w) tekst 0 (wt) tekst (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Kiedy h 1, poprzedni wyrażenie 1 w 2. W przypadku dowolnego h2, poprzednie wyrażenie 0 Powodem jest to, że z definicji niezależności wag. E (w k w j) 0 dla dowolnej kj. Ponadto, ponieważ w t oznaczają 0, E (wjwj) E (wj2) w2. W serii czasów Zastosuj ten wynik, aby uzyskać ACF podany powyżej. Inwersyjny model MA to taki, który można zapisać jako model AR nieskończonego zamówienia, który zbiega się tak, że współczynniki AR zbiegają się do 0, gdy poruszamy się nieskończenie wstecz w czasie. Dobrze wykazać inwersję modelu MA (1). Następnie zastępujemy relację (2) dla t-1 w równaniu (1) (3) (zt wt theta1 (z-taleta) wt theta1z-tal2w) W czasie t-2. równanie (2) staje się Następnie zastępujemy związek (4) dla t-2 w równaniu (3) (zt wt theta1 z - theta21w wt theta1z - eta21 (z-taleta) wt theta1z - eta12z theta31w) Gdybyśmy kontynuowali ( nieskończoność) dostaniemy model nieskończonej AR (zt wt theta1 z - theta21z theta31z-theta41z dots) Zauważ jednak, że jeśli 1 1, współczynniki mnożące opóźnienia z będą wzrastać (nieskończenie) w rozmiarze, gdy wracamy z powrotem czas. Aby temu zapobiec, potrzebujemy 1 lt1. Jest to warunek odwracalnego modelu MA (1). Model nieskoordynowanych zamówień MA W trzecim tygodniu widzimy, że model AR (1) można przekształcić w model MA nieskończonego rzędu: (xt - mu wt phi1w phi21w kropki phik1 w kropkach sumy fij1w) To sumowanie wcześniejszych białych szumów jest znane jako przyczynę reprezentacji AR (1). Innymi słowy, x t jest specjalnym rodzajem magistra z nieskończoną liczbą terminów z czasem. Nazywa się to nieskończoną kolejnością MA lub MA (). Kończy się rozkazem MA jest nieskończona kolejność AR, a dowolny porządek AR jest rzędem nieskończonym rzędu. Przypomnijmy sobie w tygodniu 1, zauważyliśmy, że wymóg stacjonarnego AR (1) polega na tym, że 1 lt1. Pozwala obliczyć Var (xt) używając reprezentacji przyczynowej. W ostatnim kroku używa się podstawowych faktów dotyczących serii geometrycznych, które wymagają (phi1lt1), w przeciwnym razie serie rozbieżności. Nawigacja

No comments:

Post a Comment