Friday 22 December 2017

Första ordningens glidande medelvärde modell


Uppskattning i första ordningens rörliga genomsnittsmodell genom den ändliga autoregressiva approximationen. Några asymptotiska resultat. Ral Pedro Mentz. University of Tucumn, Tucumn, Argentina. Tillgänglig online den 1 mars 2002.Till uppskattning i modellen ytutut 1 ser vi ett förslag från Durbin Biometrika 1969 Det består i att passa en autoregression av order k till data och härleda en uppskattning Sannolikhetsgränsen och variansen av den begränsande normala fördelningen av presenteras och diskuteras i detalj när provstorleken T men k förblir fast Skillnaderna mellan de resulterande värdena och de som motsvarar den maximala sannolikhetsestimatorn är exponentiellt minskande funktioner av k Flera modifikationer av estimatorn diskuteras och hittades konsekventa, men asymptotiskt ineffektiva. Denna studie är en del av författarens doktorsavhandling i avdelningen Av Statistik Stanford University Värdering uttrycks till professor TW Anderson för generös vägledning a Nödhjälp vid styrning av detta arbete Arbetet vid Stanford stöddes av ett forskningskontrakt med Naval Research Contract Office N00014-75-C-0442, NR-042-034, TW Anderson, Projektdirektör. Upphovsrätt 1977 Publicerad av Elsevier B V. Citera artiklar. Introduktion till ARIMA nonseasonal models. ARIMA p, d, q prognoser ekvation ARIMA-modeller är i teorin den vanligaste klassen av modeller för prognoser för en tidsserie som kan göras stationär genom differentiering om det behövs, kanske i samband Med icke-linjära transformationer som loggning eller avflöde om nödvändigt En slumpmässig variabel som är en tidsserie är stillastående om dess statistiska egenskaper är alla konstanta över tid En stationär serie har ingen trend, dess variationer runt dess medelvärde har en konstant amplitud och det vinklar i Ett konsekvent sätt dvs dess kortsiktiga slumpmässiga tidsmönster ser alltid ut i statistisk mening. Det senare tillståndet betyder att dess autokorrelationer korrelerar med sina egna tidigare avvikelser f Rom är medelvärdet konstant över tiden, eller likvärdigt, att dess effektspektrum förblir konstant över tid. En slumpmässig variabel i denna form kan ses som vanligt som en kombination av signal och brus, och signalen om man är uppenbar kan vara ett mönster av Snabb eller långsam mean reversion eller sinusformad oscillation eller snabb växling i tecken och det kan också ha en säsongskomponent. En ARIMA-modell kan ses som ett filter som försöker separera signalen från bruset och signalen extrapoleras därefter till Framtiden för att få prognoser. ARIMA-prognosen för en stationär tidsserie är en linjär dvs regressionstypsekvation där prediktorerna består av lags av den beroende variabeln och eller lags av prognosfel som är. Prediktvärdet av Y är en konstant Och eller en vägd summa av ett eller flera nya värden på Y och eller en vägd summa av en eller flera nya värden av felen. Om prediktorerna endast består av fördröjda värden på Y är det en ren autoregressiv självreaktion Gressmodell, som bara är ett speciellt fall med en regressionsmodell och som kan utrustas med standard regressionsprogram. Till exempel är en första-orders auktoregressiv AR1-modell för Y en enkel regressionsmodell där den oberoende variabeln bara Y är försenad av En period LAG Y, 1 i Statgraphics eller YLAG1 i RegressIt Om några av prediktorerna är felaktiga, är en ARIMA-modell inte en linjär regressionsmodell, eftersom det inte går att ange det senaste periodens fel som en oberoende variabel Fel måste beräknas periodvis då modellen är anpassad till data Tekniskt sett är problemet med att använda fördröjda fel som prediktorer att modellens förutsägelser inte är linjära funktioner för koefficienterna trots att de är Linjära funktioner i tidigare data Således måste koefficienter i ARIMA-modeller som innehåller fördröjda fel uppskattas genom olinjära optimeringsmetoder bergsklättring snarare än genom att bara lösa ett system av ekvationer. Akron M ARIMA står för auto-regressivt integrerat rörligt medelvärde Lags av den stationära serien i prognosförhållandet kallas autoregressiva termer, lags av prognosfel kallas glidande medelvärden och en tidsserie som behöver differentieras för att göras stationär sägs Att vara en integrerad version av en stationär serie Slumpmässiga och slumpmässiga modeller, autoregressiva modeller och exponentiella utjämningsmodeller är alla speciella fall av ARIMA-modeller. En icke-sasonlig ARIMA-modell är klassad som en ARIMA p, d, q-modell, där. p är antalet autoregressiva termer. d är antalet icke-säsongsskillnader som behövs för stationaritet, och. q är antalet fördröjda prognosfel i prediksionsekvationen. Prognosekvationen är konstruerad enligt följande. Först låt y beteckna den Skillnad på Y vilket betyder. Notera att den andra skillnaden i Y d2 fallet inte är skillnaden från 2 perioder sedan. Det är snarare den första skillnaden-av-första skillnaden som är d Iscrete analog av ett andra derivat, dvs seriens lokala acceleration i stället för sin lokala trend. När det gäller y är den allmänna prognostiseringsekvationen här. De rörliga genomsnittsparametrarna s definieras så att deras tecken är negativa i ekvationen, följt av Konvention införd av Box och Jenkins Några författare och programvara inklusive R-programmeringsspråket definierar dem så att de har plustecken i stället När faktiska siffror är anslutna till ekvationen finns det ingen tvetydighet, men det är viktigt att veta vilken konvention din programvara använder när Du läser utdata Ofta betecknas parametrarna av AR 1, AR 2, och MA 1, MA 2 etc. För att identifiera lämplig ARIMA-modell för Y börjar du genom att bestämma ordningen för differentiering, d behöver stationera serierna Och ta bort säsongens bruttoegenskaper, kanske i kombination med en variansstabiliserande transformation som loggning eller avflöde Om du slutar vid denna punkt och förutsäger att diffe Renced serien är konstant, du har bara monterat en slumpmässig promenad eller slumpmässig trendmodell. Den stationära serien kan dock fortfarande ha autokorrelerade fel, vilket tyder på att ett antal AR-termer p 1 och eller några nummer MA-termer q 1 också behövs vid prognosen Ekvationen. Processen att bestämma värdena p, d och q som är bäst för en given tidsserie kommer att diskuteras i senare avsnitt av anteckningarna vars länkar finns högst upp på den här sidan, men en förhandsvisning av några av de typerna Av nonseasonal ARIMA-modeller som vanligtvis förekommer anges nedan. ARIMA 1,0,0 första ordningens autoregressiva modell om serien är stationär och autokorrelerad, kanske den kan förutsägas som ett flertal av sitt eget tidigare värde plus en konstant prognos Ekvation i det här fallet är. Som är Y-regresserad i sig fördröjd med en period Detta är en konstant modell av ARIMA 1,0,0 Om medelvärdet av Y är noll så kommer inte den konstanta termen att inkluderas. Om lutningskoefficienten 1 är Positiv och mindre än 1 i storlek måste den vara mindre än 1 i storleksordningen om Y är stationär, beskriver modellen medelåterkallande beteende där nästa period s-värde bör förutsägas vara 1 gånger så långt bort från medelvärdet som denna period s-värde om 1 är Negativt, förutspår det medelåterkallande beteende med teckenväxling, dvs det förutspår också att Y kommer att ligga under den genomsnittliga nästa perioden om det är över medelvärdet i denna period. I en andraordningsautoregressiv modell ARIMA 2,0,0 finns det Skulle också vara en Y t-2 term till höger, och så vidare. Beroende på tecken och storheter av koefficienterna kan en ARIMA 2,0,0-modell beskriva ett system vars genomsnittliga reversering sker på ett sinusformigt oscillerande sätt, Som en massans rörelse på en fjäder som utsätts för slumpmässiga chocker. ARIMA 0,1,0 slumpmässig promenad Om serien Y inte är stationär är den enklaste möjliga modellen för en slumpmässig promenadmodell, vilken kan betraktas som en Begränsande fall av en AR 1-modell där den autoregressiva koefficienten är lika med 1, dvs en serie med oändligt långsam medelvärde. Förutsägningsekvationen för denna modell kan skrivas som. Där den konstanta termen är den genomsnittliga period-till-period-förändringen, dvs den långsiktiga driften i Y Denna modell kan monteras som en no - Intercept regressionsmodell där den första skillnaden i Y är den beroende variabeln Eftersom den endast innehåller en icke-sekundär skillnad och en konstant term, klassificeras den som en ARIMA 0,1,0-modell med konstant. Den slumpmässiga promenad-utan-driftmodellen skulle Vara en ARIMA 0,1,0-modell utan konstant. ARIMA 1,1,0-differensierad första ordningsautoregressiv modell Om felen i en slumpmässig promenadmodell är autokorrelerad kanske problemet kan lösas genom att lägga en lag av den beroende variabeln till Prediksionsekvationen - det vill säga genom att regressera den första skillnaden i Y i sig, fördröjd med en period. Detta skulle ge följande förutsägelsekvation. Det kan omordnas till. Detta är en första-orders autoregressiv modell med en ordning av icke-säsongsskillnader och en co Nstant termen - dvs en ARIMA 1,1,0 modell. ARIMA 0,1,1 utan konstant enkel exponentiell utjämning En annan strategi för att korrigera autokorrelerade fel i en slumpmässig gångmodell föreslås av den enkla exponentiella utjämningsmodellen. Kom ihåg att för en viss icke-stationär tid Serier, t. ex. de som uppvisar bullriga fluktuationer runt ett långsamt varierande medel, utför den slumpmässiga promenadmodellen inte lika bra som ett glidande medelvärde av tidigare värden. Med andra ord, snarare än att ta den senaste observationen som prognosen för nästa observation, Är bättre att använda ett genomsnitt av de sista observationerna för att filtrera bort bruset och mer exakt uppskatta det lokala medelvärdet. Den enkla exponentiella utjämningsmodellen använder ett exponentiellt vägt rörligt medelvärde av tidigare värden för att uppnå denna effekt. Förutsägningsekvationen för den enkla exponentiella Utjämningsmodell kan skrivas i ett antal matematiskt ekvivalenta former, varav en är den så kallade felkorrigeringsformen, där föregående för Ecast justeras i riktning mot felet som den gjorde. Eftersom e t-1 Y t-1 - t-1 per definition kan det skrivas om som en ARIMA 0,1,1-utan konstant prognosekvation med 1 1 - Det betyder att du kan passa en enkel exponentiell utjämning genom att ange den som en ARIMA 0,1,1 modell utan konstant, och den uppskattade MA 1-koefficienten motsvarar 1-minus-alfa i SES-formeln. Återkalla det i SES Modell är den genomsnittliga åldern för data i de 1-framåtsprogna prognoserna 1 som innebär att de tenderar att ligga bakom trender eller vändpunkter med cirka 1 perioder. Det följer att den genomsnittliga åldern för data under 1-tiden framåt Prognoser för en ARIMA 0,1,1-utan konstant modell är 1 1 - 1 Så, till exempel, om 1 0 8 är medelåldern 5 När 1 närmar sig 1, är ARIMA 0,1,1-utan konstant Modellen blir ett mycket långsiktigt glidande medelvärde, och när 1 närmar sig 0 blir det en slumpmässig promenad utan driftmodell. Vad är det bästa sättet att korrigera för autokorrelation som lägger till AR-villkor eller lägger till M A termer I de tidigare två modellerna diskuterade ovan fixades problemet med autokorrelerade fel i en slumpmässig promenadmodell på två olika sätt genom att lägga till ett fördröjt värde av den olika serien till ekvationen eller lägga till ett fördröjt värde av prognosfelet Vilket tillvägagångssätt är Bäst En tumregel för denna situation, som kommer att diskuteras mer i detalj senare, är att positiv autokorrelation vanligtvis behandlas bäst genom att addera en AR-term till modellen och negativ autokorrelation behandlas vanligtvis bäst genom att lägga till en MA-term i Affärs-och ekonomiska tidsserier uppstår negativ autokorrelation ofta som en artefakt av differentiering Generellt minskar differentieringen positiv autokorrelation och kan till och med orsaka en växling från positiv till negativ autokorrelation Således är ARIMA 0,1,1-modellen, i vilken skillnad åtföljs av En MA term, används oftare än en ARIMA 1,1,0 modell. ARIMA 0,1,1 med konstant enkel exponentiell utjämning med tillväxt Genom att implementera SES modellen som en ARIMA m Odel, du får viss flexibilitet För det första får den uppskattade MA 1-koefficienten vara negativ, vilket motsvarar en utjämningsfaktor som är större än 1 i en SES-modell, vilket vanligtvis inte är tillåtet med SES-modellproceduren. För det andra Har möjlighet att inkludera en konstant term i ARIMA-modellen om du vill, för att uppskatta en genomsnittlig icke-nollutveckling. ARIMA 0,1,1-modellen med konstant har förutsägelsesekvationen. Modellen är kvalitativt lik SES-modellen, förutom att banan för de långsiktiga prognoserna typiskt är en sluttande linje vars lutning är lika med mu snarare än en horisontell linje. ARIMA 0,2,1 eller 0,2,2 Utan konstant linjär exponentiell utjämning. Linjära exponentiella utjämningsmodeller är ARIMA-modeller som använder två icke-säsongsskillnader i kombination med MA-termer. Den andra skillnaden i en serie Y är inte bara skillnaden mellan Y och sig själv fördröjt med två perioder, men snarare är det th E första skillnaden i den första skillnaden - förändringen i förändringen av Y vid period t Således är den andra skillnaden i Y vid period t lika med Y t-Y t-1 - Y t-1 - Y T-2 Y t-2Y t-1 Y t-2 En andra skillnad på en diskret funktion är analog med ett andra derivat av en kontinuerlig funktion som mäter accelerationen eller krökningen i funktionen vid en given tidpunkt. ARIMA 0 2,2 modell utan konstant förutspår att den andra skillnaden i serien är lika med en linjär funktion av de två sista prognosfelen. Det kan omordnas som. Där 1 och 2 är MA 1 och MA 2-koefficienterna. Detta är en allmän linjär exponentiell Utjämningsmodell i stort sett samma som Holt s-modellen och Brown s-modellen är ett speciellt fall. Det använder exponentiellt viktade glidmedel för att uppskatta både en lokal nivå och en lokal trend i serien. De långsiktiga prognoserna från denna modell konvergerar till en rak linje Vars lutning beror på den genomsnittliga trenden som observerats mot slutet av serien. ARIMA 1,1,2 Utan konstant fuktad trend linjär exponentiell utjämning. Denna modell illustreras i de bifogade bilderna på ARIMA-modellerna. Den extrapolerar den lokala trenden i slutet av serien men plattar ut den vid längre prognoshorisonter för att presentera en konservatismedel, en övning som har Empiriskt stöd Se artikeln om Why the Damped Trend fungerar av Gardner och McKenzie och Golden Rule artikel av Armstrong et al för detaljer. Det är i allmänhet lämpligt att hålla sig till modeller där minst en av p och q inte är större än 1, Dvs försök inte passa en modell som ARIMA 2,1,2 eftersom det här sannolikt kommer att leda till överfitting och commonfactorproblem som diskuteras mer i detalj i anteckningarna om den matematiska strukturen för ARIMA-modeller. Spridningsutförande ARIMA Modeller som de som beskrivs ovan är lätta att genomföra på ett kalkylblad. Förutsägningsekvationen är helt enkelt en linjär ekvation som refererar till tidigare värden av ursprungliga tidsserier och tidigare värden av felen. Således c Skapa ett ARIMA prognosräkningsblad genom att lagra data i kolumn A, prognosformeln i kolumn B och feldata minus prognoser i kolumn C Prognosformeln i en typisk cell i kolumn B skulle helt enkelt vara ett linjärt uttryck som hänvisar till värden I föregående rader med kolumnerna A och C multipliceras med lämpliga AR - eller MA-koefficienter som lagras i cellerna någon annanstans på kalkylbladet. Utbildningstryckande rörelse-genomsnittlig simulering första order. Demonstrationen är inställd så att samma slumpmässiga serie punkter används oavsett hur Konstanterna och varieras Men när man trycker på slumpmässig knapp kommer en ny slumpmässig serie att genereras och användas. Att hålla slumpmässiga serien identiska gör att användaren kan se exakt effekterna på ARMA-serien av förändringar i de två konstanterna Konstanten är begränsad Till -1,1 eftersom divergensen av ARMA-serien resulterar när. Demonstrationen är endast för en första orderprocess Ytterligare AR-termer skulle möjliggöra att mer komplexa serier är gen Betygsatta, medan ytterligare MA-termer skulle öka utjämningen. För en detaljerad beskrivning av ARMA-processer, se till exempel G Box, GM Jenkins och G Reinsel, Tidsserieanalysprognoser och kontroll 3: e ed Englewood Cliffs, NJ Prentice-Hall, 1994.RELATERADE LÄNKAR.

No comments:

Post a Comment