När du beräknar ett löpande rörligt medelvärde, är det genomsnittligt att placera genomsnittet i mellantidstiden. I föregående exempel beräknade vi genomsnittet av de första 3 tidsperioderna och placerade det bredvid period 3. Vi kunde ha placerat medelvärdet mitt i tidsintervall av tre perioder, det vill säga bredvid period 2. Detta fungerar bra med udda tidsperioder, men inte så bra för jämn tid. Så vart skulle vi placera det första glidande medlet när M 4 Tekniskt sett skulle det rörliga genomsnittet falla vid t 2.5, 3.5. För att undvika detta problem släpper vi MAs med M 2. Således släpper vi de jämnderade värdena Om vi i genomsnitt ett jämnt antal termer behöver vi släta de jämnda värdena Följande tabell visar resultaten med M 4.David, Ja, MapReduce är Avsett att fungera på en stor mängd data. Och tanken är att i allmänhet ska kartan och minska funktionerna inte bryr sig om hur många mappers eller hur många reducerare det finns, det är bara optimering. Om du tänker noga på den algoritm som jag skrev upp kan du se att det spelar ingen roll vilken mappare får vilka delar av data som finns. Varje inmatningsrekord kommer att finnas tillgänglig för varje reducerad operation som behöver den. Ndash Joe K Sep 18 12 på 22:30 I bästa av min förståelse är rörligt medelvärde inte snygga kartor till MapReduce-paradigmet eftersom dess beräkning väsentligen skjuter fönstret över sorterade data medan MR behandlar icke-skurna rader av sorterade data. Lösningen jag ser är som följer: a) Att implementera anpassad partitioner för att kunna skapa två olika partitioner i två körningar. I varje körning kommer dina reducerare att få olika dataområden och beräkna glidande medelvärde där det är lämpligt att jag ska försöka illustrera: I första omgången bör data för reduktionsmedel vara: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . Här kommer du att cacluate glidande medelvärde för några Qs. I nästa steg ska dina reducerare få data som: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 och caclulate resten av glidande medelvärden. Då måste du sammanställa resultaten. Idé av anpassad partitioner att den kommer att ha två driftssätt - varje gång som delas i lika stora områden men med lite skift. I en pseudokod kommer det att se ut så här. Partition (keySHIFT) (MAXKEYnumOfPartitions) där: SHIFT kommer att tas från konfigurationen. MAXKEY maximalt värde för nyckeln. Jag antar för enkelhet att de börjar med noll. RecordReader, IMHO är inte en lösning eftersom den är begränsad till specifik delning och kan inte glida över splitsgränsen. En annan lösning skulle vara att implementera anpassad logik för att dela in data (det är en del av InputFormat). Det kan göras att göra 2 olika bilder, liknande partitionering. svarat 17 september 12 kl 8:59 Det enklaste tillvägagångssättet är att ta medeltalet januari till mars och använda det för att uppskatta April8217s försäljning: (129 134 122) 3 128 333 På grund av försäljningen från januari till mars förutspår du försäljningen I april blir 128 333. När April8217s faktiska försäljning kom in, skulle du beräkna prognosen för maj, den här gången med februari till april. Du måste överensstämma med antalet perioder du använder för att flytta genomsnittlig prognostisering. Antalet perioder du använder i dina snabba medelprognoser är godtyckliga. Du får bara använda två perioder eller fem eller sex perioder oavsett vad du vill skapa dina prognoser. Tillvägagångssättet ovan är ett enkelt glidande medelvärde. Ibland kan den senaste försäljningen av months8217 vara starkare influenser av den kommande month8217s försäljningen, så du vill ge de närmare månaderna mer vikt i din prognosmodell. Detta är ett viktat glidande medelvärde. Och precis som antalet perioder är de vikter du tilldelar rent godtyckliga. Let8217s säger att du ville ge March8217s försäljning 50 vikt, februari8217s 30 vikt och januari8217s 20. Då kommer din prognos för april att vara 127,000 (122,50) (134,30) (129,20) 127. Begränsningar av rörliga genomsnittsmetoder Flyttande medelvärden betraktas som en 8220smoothing8221 prognosteknik. Eftersom du tar ett genomsnitt över tid, mjuker du (eller utjämnar) effekterna av oregelbundna händelser inom data. Som ett resultat kan effekterna av säsongsalder, konjunkturcykler och andra slumpmässiga händelser dramatiskt öka prognosfelet. Ta en titt på en fullständig information om året8217s, och jämför ett 3-års glidande medelvärde och ett 5-års glidande medelvärde: Observera att i det här fallet att jag inte skapade prognoser utan snarare centrerade de glidande medelvärdena. Det första 3 månaders glidande genomsnittet är för februari, och it8217s är i genomsnitt januari, februari och mars. Jag gjorde också liknande för 5-månaders genomsnittet. Ta en titt på följande diagram: Vad ser du Är inte den tremånadersrörande genomsnittsserien mycket mjukare än den faktiska försäljningsserien Och hur är det med det femmånaders glidande genomsnittet It8217s jämnare. Därför, ju fler perioder du använder i ditt glidande medelvärde, ju mjukare din tidsserie. För prognoser kan därför ett enkelt glidande medelvärde inte vara den mest exakta metoden. Flytta genomsnittliga metoder är ganska värdefulla när man försöker extrahera säsongs-, oregelbundna och cykliska komponenter i en tidsserie för mer avancerade prognosmetoder, som regression och ARIMA, och användningen av glidande medelvärden vid sönderdelning av en tidsserie kommer att behandlas senare I serien. Fastställa noggrannhet för en rörlig genomsnittsmodell Vanligtvis vill du ha en prognosmetod som har minst fel mellan aktuella och förutsagda resultat. En av de vanligaste åtgärderna för prognosnoggrannhet är den genomsnittliga absoluta avvikelsen (MAD). I den här metoden tar du det absoluta värdet av skillnaden mellan den period8217s faktiska och prognostiserade värden (avvikelsen) för varje period i de tidsserier som du genererade en prognos för. Då är du genomsnittliga de absoluta avvikelserna och du får ett mått på MAD. MAD kan vara till hjälp när du bestämmer hur mycket antal perioder du har, och hur stor vikt du lägger på varje period. I allmänhet väljer du den som resulterar i lägsta MAD. Here8217s ett exempel på hur MAD beräknas: MAD är helt enkelt genomsnittet av 8, 1 och 3. Flytta genomsnitt: Recap När du använder glidande medelvärden för prognoser, kom ihåg: Flytta medelvärden kan vara enkla eller viktade Antalet perioder du använder för din medelvärdet och alla vikter du tilldelar var och en är strängt godtyckligt. Flyttande medelvärden släpper ut oregelbundna mönster i tidsseriedata, desto större antal perioder som används för varje datapunkt desto större utjämningseffekt. På grund av utjämning prognostiseras nästa månad8217s försäljning baserat på senaste månaden8282s försäljning kan resultera i stora avvikelser på grund av säsongsmässiga, konjunkturella och oregelbundna mönster i data och utjämningsförmågan hos en glidande genomsnittsmetod kan vara användbar för att sönderdela en tidsserie för mer avancerade prognosmetoder. Nästa vecka: Exponentiell utjämning I nästa vecka8217s prognos fredag. Vi kommer att diskutera exponentiella utjämning metoder, och du kommer att se att de kan vara långt överlägsen att röra genomsnittliga prognostiseringsmetoder. Fortfarande don8217t vet varför våra prognos fredags inlägg visas på torsdag Hitta ut på: tinyurl26cm6ma Gilla detta: Postnavigering Lämna ett svar Avbryt svar Jag hade 2 frågor: 1) Kan du använda den centrerade MA-metoden för att prognostisera eller bara för att ta bort säsongsbetonat 2) När du använder den enkla t (t-1t-2t-k) k MA för att prognostisera en period framåt, är det möjligt att prognostisera mer än en period framåt Jag antar att din prognos skulle vara en av punkterna som matar in i nästa. Tack. Älska informationen och dina förklaringar I8217m glad att du gillar bloggen I8217 är säker på att flera analytiker har använt det centrerade MA-tillvägagångssättet för prognoser, men jag skulle inte personligen, eftersom den här metoden resulterar i en förlust av observationer i båda ändarna. Detta knyter i själva verket då till din andra fråga. I allmänhet används enkel MA för att endast prognosera en period framåt, men många analytiker 8211 och jag, ibland 8211, kommer att använda min framtidsprognos som en av insatserna till andra perioden framöver. It8217 är viktigt att komma ihåg att ju längre in i framtiden du försöker att prognostisera desto större är risken för prognosfel. Det är därför jag inte rekommenderar centrerad MA för prognoser 8211 innebär förlusten av observationer i slutet att man måste förlita sig på prognoser för de förlorade observationerna, såväl som perioden (er) framåt, så det finns större risk för prognosfel. Läsare: you8217 är inbjudna att väga in på detta. Har du några tankar eller förslag på denna Brian, tack för din kommentar och dina komplimanger på bloggen Trevligt initiativ och bra förklaring. It8217s är verkligen till hjälp. Jag förutser anpassade kretskort för en kund som inte ger några prognoser. Jag har använt det rörliga genomsnittet, men det är inte så mycket som industrin kan gå upp och ner. Vi ser fram mot mitten av sommaren till slutet av året att frakt pcb8217s är uppe. Sedan ser vi i början av året sakta ner. Hur kan jag vara mer exakt med mina data Katrina, från vad du sa till mig, verkar det att din tryckta kretskortsförsäljning har en säsongskomponent. Jag tar upp säsongsbetonade i några av de andra prognoserna fredagens inlägg. En annan metod som du kan använda, vilket är ganska lätt, är Holt-Winters-algoritmen, som tar hänsyn till säsonglighet. Du kan hitta en bra förklaring av det här. Var noga med att avgöra om dina säsongsbetonade mönster är multiplikativa eller additiva, eftersom algoritmen är lite annorlunda för var och en. Om du plottar dina månadsdata från några år och ser till att säsongsvariationerna vid samma årstid verkar vara konstanta år över år, så är säsongsalden additiv om säsongsvariationerna över tiden verkar öka, då säsongsmässigheten är multiplikativ. De flesta säsongsbundna tidsserierna kommer att vara multiplicativa. Om du är osäker, antar du multiplikativ. Lycka till, Hej där, mellan den här metoden:. Nave Forecast. Uppdatering av medelvärdet. Flyttande medelvärdet av längden k. Varken Viktad Flytta Genomsnittlig längd k ELLER Exponentiell utjämning Vilken av de uppdaterande modellerna rekommenderar du att jag använder för att prognostisera data Enligt min åsikt tänker jag på Moving Average. Men jag vet inte hur man klargör och strukturerar det. Det beror verkligen på kvantiteten och kvaliteten på de data du har och din prognostiseringshorisont (långsiktig, medellång eller kort sikt). 6.2 Flytta genomsnittsvärden ma 40 elecsales, beställa 5 41 I den andra kolumnen i denna tabell visas ett glidande medelvärde av order 5, vilket ger en uppskattning av trendcykeln. Det första värdet i denna kolumn är medeltalet av de första fem observationerna (1989-1993) det andra värdet i 5-MA kolumnen är medelvärdet av värdena 1990-1994 och så vidare. Varje värde i 5-MA kolumnen är genomsnittet av observationerna under femårsperioden centrerad på motsvarande år. Det finns inga värden för de två första åren eller de senaste två åren eftersom vi inte har två observationer på vardera sidan. I ovanstående formel innehåller kolumn 5-MA värden på hatt med k2. För att se hur trendcykeluppskattningen ser ut, kartlägger vi den tillsammans med de ursprungliga uppgifterna i Figur 6.7. plot 40 elecsales, huvudsakliga quotResidential electricity salesquot, ylab quotGWhquot. xlab quotYearquot 41 linjer 40 ma 40 elecsales, 5 41. col quotredquot 41 Lägg märke till hur trenden (i rött) är mjukare än originaldata och fångar huvudrörelsen för tidsserierna utan alla mindre svängningar. Den rörliga genomsnittsmetoden tillåter inte uppskattningar av T där t ligger nära seriens ändar, därför sträcker sig den röda linjen inte till kanterna på grafen på båda sidor. Senare kommer vi att använda mer sofistikerade metoder för trendcykeluppskattning som tillåter uppskattningar nära slutpunkterna. Ordningen för glidande medel bestämmer jämnheten i trendcykeluppskattningen. I allmänhet betyder en större ordning en mjukare kurva. Nedanstående diagram visar effekten av att ändra ordningen för glidande medelvärdet för elförsäljningsdata för bostäder. Enkla glidande medelvärden som dessa är vanligen oddliga ordningar (t ex 3, 5, 7 osv.) Det här är så att de är symmetriska: I ett glidande medelvärde av ordningen m2k1 finns k tidigare observationer, k senare observationer och medellaggen som är genomsnittliga. Men om m var jämn, skulle det inte längre vara symmetrisk. Flytta medelvärden för glidande medelvärden Det är möjligt att använda ett glidande medelvärde till ett glidande medelvärde. En anledning till att göra detta är att skapa en jämn ordning med glidande medelvärde. Till exempel kan vi ta ett glidande medelvärde av order 4 och sedan tillämpa ett annat glidande medelvärde av order 2 till resultaten. I tabell 6.2 har detta gjorts under de första åren av australiensiska kvartalsvisa ölproduktionsdata. beer2 lt - window 40 ausbeer start 1992 41 ma4 lt 40 beer2, order 4. center FALSE 41 ma2x4 lt 40 beer2, order 4. center TRUE 41 Notationen 2times4-MA i den sista kolumnen betyder en 4-MA följt av en 2-MA. Värdena i den sista kolumnen erhålls genom att ta ett glidande medelvärde av ordning 2 av värdena i föregående kolumn. De första två värdena i 4-MA-kolumnen är exempelvis 451,2 (443410420532) 4 och 448,8 (410420532433) 4. Det första värdet i kolumnen 2times4-MA är medelvärdet av dessa två: 450,0 (451.2448.8) 2. När en 2-MA följer ett glidande medelvärde av jämn ordning (till exempel 4) kallas det ett centrerat glidande medelvärde av order 4. Detta beror på att resultaten nu är symmetriska. För att se att så är fallet kan vi skriva 2times4-MA enligt följande: starta huvuden från Bigfrac (y y y y) frac (y y y y) Stor förstärkare frac14y frac14y frac14y frac18y. slutet Det är nu ett vägt genomsnitt av observationer, men det är symmetriskt. Andra kombinationer av glidande medelvärden är också möjliga. Till exempel används en 3times3-MA ofta och består av ett glidande medelvärde av order 3 följt av ett annat glidande medelvärde av order 3. I allmänhet bör en jämn order MA följas av en jämn order MA för att göra den symmetrisk. På liknande sätt bör en udda order MA följas av en udda order MA. Uppskatta trendcykeln med säsongsdata Den vanligaste användningen av centrerade glidmedel är att uppskatta trendcykeln från säsongsdata. Tänk på 2times4-MA: hat frac y frac14y frac14y frac14y frac18y. När de tillämpas på kvartalsdata får varje kvartal av året lika stor vikt som de första och sista villkoren gäller för samma kvartal i följdår. Följaktligen kommer säsongsvariationen att medelvärdes ut och de resulterande värdena på hatt t kommer att ha liten eller ingen säsongsvariation kvar. En liknande effekt skulle erhållas med användning av en 2 x 8-MA eller 2 x 12-MA. I allmänhet motsvarar en 2-timmars m-MA ett vägat glidande medelvärde av ordning m1 med alla observationer som tar 1m med undantag för de första och sista termerna som tar vikter 1 (2m). Så om säsongsperioden är jämn och i ordning m, använd en 2-timmars m-MA för att uppskatta trendcykeln. Om säsongsperioden är udda och av ordning m, använd en m-MA för att uppskatta trendcykeln. I synnerhet kan en 2times 12-MA användas för att uppskatta trendcykeln för månadsdata och en 7-MA kan användas för att uppskatta trendcykeln för dagliga data. Andra val för MA-ordningen kommer vanligen att resultera i att trendcykeluppskattningar är förorenade av säsongsmässigheten i data. Exempel 6.2 Tillverkning av elektrisk utrustning Figur 6.9 visar en 2times12-MA applicerad på elutrustningens orderindex. Observera att den släta linjen inte visar någon säsongsmässighet är nästan lika med trendcykeln som visas i Figur 6.2, som uppskattades med en mycket mer sofistikerad metod än glidande medelvärden. Något annat val för ordningen för glidande medelvärde (förutom 24, 36 etc.) skulle ha resulterat i en jämn linje som visar vissa säsongsvariationer. Plot 40 elecequip, ylab quotNew orders indexquot. Col quotgrayquot, huvudkvotproduktionstillverkning (Euro area) cv 41 linjer 40 ma 40 elecequip, order 12 41. col quotredquot 41 Vägt glidmedelvärde Kombinationer av glidande medelvärden resulterar i viktade glidmedelvärden. Exempelvis motsvarar 2x4-MA diskuterade ovan en vägd 5-MA med vikter ges av frac, frac, frac, frac, frac. I allmänhet kan en vägd m-MA skrivas som hat t sum k aj y, där k (m-1) 2 och vikterna ges med a, prickar, ak. Det är viktigt att vikterna alla summerar till en och att de är symmetriska så att aj a. Den enkla m-MA är ett speciellt fall där alla vikter är lika med 1m. En stor fördel med vägda glidande medelvärden är att de ger en jämnare uppskattning av trendcykeln. I stället för observationer som går in i och lämnar beräkningen vid full vikt, ökas deras vikter långsamt och sakta sakta minskar vilket resulterar i en jämnare kurva. Vissa specifika uppsättningar vikter används ofta. Några av dessa anges i tabell 6.3.
Comments
Post a Comment