Laiko eilučių modeliai Laiko eilutės išskaidymas, glodinimas ir filtravimas 2016-09-22.

Slides:



Advertisements
Panašios pateiktys
Laisvės ir kalnų šauksmas
Advertisements

“Ieškosiu Tavo veido...” pagal Isabel Guerra.
Lakštingala, čiulbanti 100 metų
Gėlių horoskopas MOTERIMS
Juozas Aputis (g. 1936) – rašytojas, bandantis surankioti ir savaip sudėlioti pasaulio grožį ir neįžvelgiamą jo gelmę reiškiančius žodžius. Parengė Vilniaus.
ATRASK DIEVO PAŠAUKIMĄ
III klasių viktorina Paruošė G.Baublienė ir L.Venskutė
Pateikties kopija:

Laiko eilučių modeliai Laiko eilutės išskaidymas, glodinimas ir filtravimas 2016-09-22

Turinys Laiko eilutės samprata Laiko eilutės klasikinis išskaidymas Laiko eilutės eksponentinis glodinimas Laiko eilutės filtrai Prognozių tikslumo matai

1.Laiko eilutės samprata Laiko eilutė (laiko seka) –reiškinio periodiškų stebėjimų visuma, kurių duomenys tai periodo metu fiksuoti stebėjimų dydžiai arba stebimų dydžių suma. Laiko eilutės gali būti suformuotos iš įvairaus dažnumo, tačiau vienodo periodiškumo duomenų: valandinių, kasdienių, savaitinių, mėnesinių, metinių ir pan.

Laiko eilutės samprata Laiko eilučių tipai: Momentinės Intervalinės

Laiko eilučių duomenų tipai: Absoliutūs (Yt) Absoliutūs pokyčiai/prieaugiai (ΔYt= Yt- Yt-1) Augimo tempas (T= Yt./ Yt-1) Pokyčių tempas (Tpokyčių= ΔYt/Yt-1 ~ ln(Yt)

3.Laiko eilutės išskaidymas slenkančių vidurkiu metodu Laiko eilutės (Yt ) komponentai: trendas (T) cikliniai svyravimai (C) sezoniniai svyravimai (S), atsitiktiniai svyravimai (A). Yt= f(Tt; Ct; St; At)

Laiko eilutės išskaidymas Du laiko eilutės išskaidymo būdai: Sumos : Sandaugos Yt= Tt + Ct + St+ At Yt= Tt ٠ Ct ٠ St ٠ At

Laiko eilutės išskaidymas Išskaidymo būdo pasirinkimas Yt= Tt + Ct + St+ At Yt= Tt ٠ Ct ٠ St ٠ At

Laiko eilutės išskaidymas Slenkančių vidurkių metodu Slenkančių vidurkių rūšys Paprastas Svertinis Centruotas Tokiu būdu nustatomas trendo ir ciklinių svyravimų komponentų bendras dydis

Slenkančių vidurkių rūšys Paprastas Suteikia vienodą svorį visiems slenkantį vidurkį sudarantiems n stebėjimams MAt= 1/n yt-n+i =1/n (yt+yt-1 +…+yt-n+1)

Slenkančių vidurkių rūšys Svertinis WMAt= (i*yt-n+i)/i = [nyt+(n-1)yt-1+…+1yt-n+1]/ [n+(n-1)+…+1] Stebėjimų svoriai yra skirtingi. Svorių priskyrimo schemos gali būti įvairios. Pavyzdyje pateikiamas variantas, kai vėlesniam stebėjimui priskiriamas vis mažesnis svoris.

Slenkančių vidurkių rūšys Centruotas CMAt= 1/n yi = 1/n [yt+(n-1)/2 + yt+(n-1)/2-1+…+ yt-(n-1)/2 ] Išlyginimas realizuojamas pakeičiant pirminės laiko eilutės reikšmes vidurkiu, suformuotu iš vienodo skaičiaus prieš stebėjimą ir po stebėjimo esančių stebėjimų. Šio slenkančio vidurkio trūkumas - vėliausiems periodams slenkantys vidurkiai nėra apskaičiuojami. Slenkančio vidurkio dėmenų skaičius (n) turi būti nelyginis.

Laiko eilutės išskaidymas Sezoniškumo indeksų nustatymas slenkančių vidurkių metodu Slenkančių vidurkių metodu išlyginami pirminiai stebėjimai (Yt). Išlygintoje eilutėje: (Tt ٠Ct) arba (Tt+Ct) lieka (St ٠ At) arba (St + At) eliminuojama Slenkantį vidurkį reikia papildomai centruoti, kai slenkančio vidurkio dėmenų skaičius yra lyginis t.y. iš slenkančio vidurkio reikšmių apskaičiuoti dviejų dėmenų (n=2) slenkančius vidurkius, Tokiu būdu nustatomas trendo ir ciklinių svyravimų komponentų bendras dydis

DU_priv pradiniai duomenys ir išlyginta eilutė slenk. vidurkiais

Laiko eilutės išskaidymas Sezoniškumo indeksų nustatymas Sezoniškumo komponentės išskyrimas Iš faktinių Yt reikšmių atimant slenkančių vidurkių reikšmes, t.y., eliminuojant trendo ir ciklinių svyravimų bendrą komponentę, nustatomas sezoniškumo ir atsitiktinumo komponentų bendras dydis: St+At = Yt - ( Tt + Ct.) St٠At = Yt / Tt ٠ Ct

Laiko eilutės išskaidymas Sezoniškumo indeksų nustatymas Sezoniškumo komponentę išskiriame apskaičiuodami atitinkamų periodų (visų laiko eilutės atitinkamų ketvirčių, pvz., I ketvirčio) (St+At) arba (St ٠ At) reikšmių virdurkį. Apskaičiuotas vidurkis yra atitinkamo periodo sezoniškumo indeksas - St

Darbo užmokesčio sezoniškumo indeksai

Užimtumo sezoniškumo indeksai

Laiko eilutės išskaidymas Duomenų desezonizavimas Nustačius sezoniškumo komponentę, iš laiko eilučių pirminių duomenų eliminuojama jo įtaka: Tt+Ct+At = Yt – St Tt٠ Ct٠ At = Yt / St

Laiko eilutės išskaidymas Trendo nustatymas 4. Eliminavus sezoniškumą, galima nustatyti esminę laiko eilutės kitimo tendenciją-trendą Trendas dažniausiai nustatomas MKM

Laiko eilutės išskaidymas Trendo nustatymas Dažniausiai naudojamos trendo funkcijos Pavadinimas Pirminė išraiška Į tiesinę formą transformuota išraiška Tiesinė Yt=a+bt Eksponentinė Yt=a*ebt lnYt=lna+b*t Hiperbolinė Yt=a+b/t Yt=a+bT, kur T=1/t Logaritminė Yt=a+b*lnt Yt=a+bT, kur T=lnt Rodiklinė Yt=a*tb lnYt=lna+b*lnt

Cikliniai svyravimai 5. Cikliniai svyravimai nustatomi eliminavus trendo komponentę iš išlygintos eilutės Ct = (Tt+Ct )- Tt Ct = Tt٠ Ct / Tt

Išskaidyta du_priv laiko eilutė

Laiko eilutės išskaidymo privalumai ir ribotumai: Leidžia matyti laiko eilutės sandarą ir kitimo aspektus Naudinga preliminari priemonė prognozavimo metodams parinkti Ribotumai: Retai kada naudojama prognozavimui dėl ciklo ir atsitiktinės komponenčių neprognozuojamumo

4. Laiko eilutės eksponentinis glodinimas (EG) Tai dar vienas būdas analizuoti ir prognozuoti laiko eilutes EG būdai: Paprastas Dvigubas Trigubas

Eksponentinis glodinimas Paprastas S1= Y1 S2= α Y2+(1- α) S1 Bendru atveju St= α Yt+(1- α) St-1, St= α[Yt+(1- α)Yt-1+(1- α)2Yt-2+…]+ (1- α)t-1Y1

Eksponentinis glodinimas Paprastas Faktoriaus α ypatumai 0 <α <1 Yt labai stipri atsitiktinių svyravimų įtaka: Yt - labai inertiškas procesas t.y.stipriai priklauso nuo Yt-1 . α 1 α 0 Faktoriaus α nustatymo būdai: analitiko nuožiūra parenkamas α išlyginimo faktorius MKM nustatomas α toks, kuris minimizuoja paklaidų kvadratų sumą.

Eksponentinis glodinimas Dvigubas (Holt’o tiesinis) Jeigu laiko eilutė turi trendą, taikomas dvigubas eksponentinio išlyginimo metodas.

Eksponentinis glodinimas Dvigubas (Holt’o tiesinis) St= αYt+(1- α)(St-1+bt-1) Suglodinta stebėjimo reikšmė bt=β(St-St-1)+(1- β)bt-1 Suglodinta trendo reikšmė Ft+m=St+btm Prognozės reikšmė α ir β glodinimo koeficientai St – suglodinta t stebėjimo reikšmė bt –trendo suglodinta t reikšmė Ft+m prognozės reikšmės m- periodų į priekį

Eksponentinis glodinimas Dvigubas (Holt’o tiesinis) b0 glodinimo koeficiento nustatymo būdai: b0 prilyginti 0 (tinka, kai eilutė yra ilga) MKM apskaičiuoti pirmų penkių laiko eilutės narių trendo lygtį Yt =a+bt ir b0 =b

Eksponentinis glodinimas Trigubas (Holt’o Winterio) glodinimas Trigubas arba Holt‘o Winterio sezoninis glodinimas taikomas tuomet, kai laiko eilutei būdingas trendas ir sezoniniai svyravimai. Sezoniškumas gali būti adityvus arba multiplikatyvus

Eksponentinis glodinimas Trigubas (Holt’o Winterio) glodinimas α ir β ir γ glodinimo koeficientai St – suglodinta t stebėjimo reikšmė bt –trendo suglodinta t reikšmė ct –sezoniškumo įtakos faktorius Ft+m prognozės reikšmės m- periodų į priekį L-periodų skaičius metuose (pvz. ketvirtiniuose duom. L=4, mėnesiniams L=12)

Eksponentinis glodinimas trigubas (Holt’o Winterio sezoninis) b0 ir c 1-L glodinimo koeficiento nustatymo būdai: β0 prilyginti 0, o sezoniškumo indeksus c1-L =1 MKM apskaičiuoti pirmų penkių laiko eilutės narių trendo lygtį Yt =a+bt ir β0 =b

Eksponentinis glodinimas DU

Eksponentinis glodinimas DU Paprastas EG Dvigubas EG Prognozė Prognozė Prognozė Trigubas EG

Eksponentinis glodinimas UŽ

Eksponentinis glodinimas UŽ Paprastas EG Prognozė Prognozė Tribubas EG Prognozė

Eksponentinis išlyginimas Apibendrinimas Kada kokį metodą taikyti Sezoniškumas Trendas Nėra sezoniškumo Pastovus(adityvus)sezoniškumas Kintantis (multiplikatyvus) sezoniškumas Nėra trendo Paprastas EG HW aditive HWmultiplikative Tiesinis trendas Dvigubas išlyginimas Netiesinis trendas HW no seasons

Eksponentinis išlyginimas Apibendrinimas Kada kokį metodą taikyti Sezoniškumas Trendas Nėra sezoniškumo Adityvus sezoniškumas Multiplikatyvus sezoniškumas Nėra trendo Tiesinis trendas Netiesinis trendas

5 Laiko eilučių filtrai Filtrų tipai: Hodrick- Prescott filtras Dažnių filtras (magisratūroje)

Hodrick-Prescott filtras Pagrindinė idėja: 𝑌 𝑡 laiko eilutė išskaidoma į trendo ir ciklo komponentes 𝑌 𝑡 = τ 𝑡 + 𝜁 𝑡 Laiko seka Trendas Ciklas

Hodrick-Prescot filtras Filtro nustatymo procedūra Nustatomas ilgalaikis trendas τ Randama ciklo kreivė ζ, atimant trendo reikšmes τ iš laiko eilutės Y duomenų,

Hodrick-Prescott filtras Trendo nustatymo metodas 𝐦𝐢𝐧 𝝉 𝒕=𝟏 𝑻 ( 𝒀 𝒕 − τ 𝒕 ) 𝟐 +λ 𝒕=𝟏 𝑻 { τ 𝒕+𝟏 − τ 𝑡 −( τ 𝒕 − τ 𝒕−𝟏 )} 𝟐 Minimizuojami trendo nuokrypiai = maksimizuojamas trendo atitikimas duom. sekai Y Minimizuojami trendo šuoliai = maksimizuojamas trendo tolygumas

Hodrick-Prescott filtras λ - filtro suglodinimo (išlyginimo parametras) kuo λ didesnis tuo labiau suglodinama trendo kreivė. kai λ=∞, tuomet trendo linija tampa tiese Hodrick-Prescot siūlomos λ reikšmės 100 - metiniai duomenys λ= 1600 ketvirtiniai duomenys 14400 mėnesiniai duomenys

Hodrick-Prescott filtras Trendo nustatymo formulė 𝐦𝐢𝐧 𝝉 𝒕=𝟏 𝑻 ( 𝒀 𝒕 − τ 𝒕 ) 𝟐 +λ 𝒕=𝟏 𝑻 { τ 𝒕+𝟏 − τ 𝑡 −( τ 𝒕 − τ 𝒕−𝟏 )} 𝟐 τ = [𝐼+ λ 𝐾 ′ 𝐾] −1 𝑌 I –vienetinė TxT matavimų matrica K tai stačiakampė (T-2)xT matavimų matrica, kurios elementai [ 𝑘 𝑖𝑗 ] yra lygūs: 1 , i=j arba i=j+2 𝑘 𝑖𝑗 = -2 , kai i=j+1 0 kitais atvejais

Hodrick-Prescott filtras

Hodrick-Prescott filtras Pvz. 1 -2 1 0 0 K= 0 1 -2 1 0 0 0 1 -2 1 1+λ -2λ λ 0 0 I+λK’K= -2λ 1+5λ -4λ λ 0 λ -4λ 1+6λ -4λ λ 0 λ -4λ 1+5λ -2λ 0 0 λ -2λ 1+ λ

Hodrick-Prescott filtras Pvz. τ 1 1+λ -2λ λ 0 0 −1 𝑌 1 τ 2 -2λ 1+5λ -4λ λ 0 𝑌 2 τ 4 = λ -4λ 1+6λ -4λ λ 𝑌 3 τ 5 0 λ -4λ 1+5λ -2λ 𝑌 4 τ 1 0 0 λ -2λ 1+ λ 𝑌 5 Tarkime turime metinius duomenis λ=100 Y = (2,4, 4, 5,3,1 )

Hodrick-Prescott filtras Pvz. τ 1 101 -200 100 0 0 −1 2 τ 2 -200 501 -400 100 0 4 τ 4 = 100 -400 601 -400 100 4 τ 5 0 100 -400 501 -200 5 τ 1 0 0 100 -200 101 3 Tarkime turime metinius duomenis λ=100 Y = (2,4, 4, 5,3 )

Hodrick-Prescott filtras Pvz. τ 1 2 4 5 3 0,603559 0,398019 0,196444 -0,00118 -0,19684 0,30169 0,20138 0,100093 0,204351 =

Hodrick-Prescott filtras Pvz. 2,99 3,31 3,61 3,91 4,19 -0,99 0,69 0,39 1,09 -1,19 = TRENDAS CIKLAS =

Hodrick-Prescott filtras Įžvalgos Hodrick Prescott filtras [𝐼+ λ 𝐾 ′ 𝐾] −1 , nepriklauso nuo laiko eilutės reikšmių, o priklauso nuo stebėjimų skaičiaus T ir λ

Hodrick-Prescott filtras Privalumai Kritika

Du_priv Hodrick Prescott filtras

Uz_priv Hodrick Prescott filtras

5 Laiko eilučių prognozės tikslumas Prognozių tikslumas Teisingo metodo parinkimas Duomenų pakankamumas Prognozės horizonto parinkimas Prognozuojamo proceso pastovumas

5. Prognozių tikslumo matai RSS– prognozės paklaidų kvadratų suma: MSE – vidutinė kvadratinė paklaida: RMSE – šaknis iš vidutinės kvadratinės paklaidos: t- stebėjimų, k – modelio parametrų skaičius.

5. Prognozių tikslumo matai MAE – vidutinė absoliutinė paklaida MAPEvidutinė absoliuti procentinė paklaida :

5. Prognozių tikslumo matai AIC – Akaike’s informacijos kriterijus: BIC (SBC) – Schwarz kriterijus Determinacijos koeficientas Maksimalaus tikėtinumo kriterijus

5. Prognozių tikslumo matai Maksimalaus tikėtinumo kriterijus (Log likelihood) l= 𝑇 2 (1+ln 2π +ln⁡( 𝑅𝑆𝑆 2 ))

5. Prognozių tikslumo matai AIC – Akaike’s informacijos kriterijus: 𝐴𝐼𝐶=−2 𝑙/𝑇 +2 (𝑘/𝑇) (SC) – Schwarz kriterijus SC=−2 𝑙/𝑇 +2𝑘ln(𝑇)/𝑇