Apibendrintieji tiesiniai modeliai

Slides:



Advertisements
Panašios pateiktys
Laisvės ir kalnų šauksmas
Advertisements

“Ieškosiu Tavo veido...” pagal Isabel Guerra.
Lakštingala, čiulbanti 100 metų
Gėlių horoskopas MOTERIMS
Juozas Aputis (g. 1936) – rašytojas, bandantis surankioti ir savaip sudėlioti pasaulio grožį ir neįžvelgiamą jo gelmę reiškiančius žodžius. Parengė Vilniaus.
ATRASK DIEVO PAŠAUKIMĄ
III klasių viktorina Paruošė G.Baublienė ir L.Venskutė
Pateikties kopija:

Apibendrintieji tiesiniai modeliai Seesam Insurance AS Lietuvos filialas Įmokų skaičiavimas ne gyvybės draudime: Apibendrintieji tiesiniai modeliai Rasa Ivanovaitė 2018-06-26

Apibendrintųjų tiesinių modelių taikymas įmokų nustatymui

Apibendrintieji tiesiniai modeliai įmokų nustatymui Seniau kainodaroje buvo naudojama vienfaktorė analizė

Draudėjo amžius Holder age

Drausmingumo kategorijos

Apibendrintieji tiesiniai modeliai įmokų nustatymui Seniau kainodaroje buvo naudojama vienfaktorė analizė Apie 1960 metus aktuarai pritaikė MKM Paprasčiausias tiesinis modelis yra: 𝑌=𝜇+𝜀 𝑌= 𝛽 0 + 𝛽 1 𝑋 1 + 𝛽 2 𝑋 2 + … + 𝜀 𝑌=𝑋∙𝛽+𝜀, 𝜀~𝑁(0; 𝜎 2 ) Pavyzdys 1: Nagrinėjame nekomercinio sektoriaus lengvųjų automobilių draudimą, priklausomą nuo dviejų faktorių: teritorijos (miestas arba kaimas) ir lyties (vyras arba moteris). Stebime tokias vidutines žalas: Miestas Kaimas Vyras 800 500 Moteris 400 200

Pavyzdys 1 Miestas Kaimas Vyras 800 500 Moteris 400 200 Aiškinamasis kintamasis 𝑌 yra vidutinės žalos dydis. Aiškinantieji kintamieji 𝑋 𝑖 –teritorija ir lytis, tačiau modelyje jų gauname net 4: Vyras / moteris ( 𝑋 1 ir 𝑋 2 ) Miestas / kaimas ( 𝑋 3 ir 𝑋 4 ) 𝑌= 𝑌 1 𝑌 2 𝑌 3 𝑌 4 = 𝑉𝑦𝑟𝑎𝑠, 𝑚𝑖𝑒𝑠𝑡𝑎𝑠 𝑉𝑦𝑟𝑎𝑠, 𝑘𝑎𝑖𝑚𝑎𝑠 𝑀𝑜𝑡𝑒𝑟𝑖𝑠, 𝑚𝑖𝑒𝑠𝑡𝑎𝑠 𝑀𝑜𝑡𝑒𝑟𝑖𝑠, 𝑘𝑎𝑖𝑚𝑎𝑠 = 800 500 400 200 ; 𝑋 − indikatorių matrica = 1 0 1 1 0 0 0 0 1 1 1 0 β= 𝐾𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑎𝑠 𝑣𝑦𝑟𝑎𝑚𝑠 𝐾𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑎𝑠 𝑚𝑜𝑡𝑒𝑟𝑖𝑚𝑠 𝐾𝑜𝑒𝑓𝑖𝑐𝑒𝑛𝑡𝑎𝑠 𝑚𝑖𝑒𝑠𝑡𝑢𝑖 = 𝛽 1 𝛽 2 𝛽 3 ; 𝜀 − paklaidų matrica = 𝜀 1 𝜀 2 𝜀 3 𝜀 4 .

Pavyzdys 1 Turime lygtis: Minimizuojame paklaidas: 𝑌 1 =800= 𝛽 1 +0+ 𝛽 3 + 𝜀 1 𝑌 2 =500= 𝛽 1 +0+0+ 𝜀 2 𝑌 3 =400= 0+𝛽 2 + 𝛽 3 + 𝜀 3 𝑌 4 =200=0+ 𝛽 2 +0+ 𝜀 4 Minimizuojame paklaidas: 𝑆𝑆𝐸= 𝜀 1 2 + 𝜀 2 2 + 𝜀 3 2 + 𝜀 4 2 =( 800− 𝛽 1 − 𝛽 3 ) 2 +( 500− 𝛽 1 ) 2 + 400− 𝛽 2 − 𝛽 3 2 + (200− 𝛽 2 ) 2 𝜕𝑆𝐸𝐸 𝜕 𝛽 1 =0→ 𝛽 1 + 𝛽 3 + 𝛽 1 =800+500=1300 𝜕𝑆𝐸𝐸 𝜕 𝛽 2 =0→ 𝛽 2 + 𝛽 3 + 𝛽 2 =400+200=600 𝜕𝑆𝐸𝐸 𝜕 𝛽 3 =0→ 𝛽 1 + 𝛽 3 + 𝛽 2 + 𝛽 3 =800+400=1200 Gauname: 𝛽 1 =525; 𝛽 2 =175; 𝛽 3 =250 Miestas Kaimas Vyras 775 525 Moteris 425 175

Apibendrinimas 𝑌=𝑋∙𝛽+𝜀 Jei 𝜂=𝑋∙𝛽, tai 𝐸 𝑌 =𝜇= 𝑔 −1 𝜂 Keturių kintamųjų atveju: 𝐸 𝑌 = 𝑔 −1 𝑋∙𝛽 = 𝑔 −1 ( 𝛽 1 + 𝛽 3 ) 𝑔 −1 ( 𝛽 1 ) 𝑔 −1 ( 𝛽 2 + 𝛽 3 ) 𝑔 −1 ( 𝛽 2 ) Nagrinėjome modelį: 𝑌=𝑋∙𝛽+𝜀, 𝜀~𝑁(0; 𝜎 2 ) 𝐸 𝑌 = 𝑔 −1 𝑋∙𝛽 = 𝛽 1 + 𝛽 3 𝛽 1 𝛽 2 + 𝛽 3 𝛽 2 Normaliojo skirstinio tankio funkcija: 𝑓(𝑦; 𝜇, 𝜎 2 )=𝑒𝑥𝑝{− 𝑦−𝜇 2 2 𝜎 2 − 1 2 𝑙𝑛 2𝜋 𝜎 2 }

Apibendrinimas Tuomet didžiausio tikėtinumo funkcija: 𝐿(𝑦; 𝜇, 𝜎 2 )= 𝑖=1 𝑛 𝑒𝑥𝑝{− 𝑦 𝑖 −𝜇 2 2 𝜎 2 − 1 2 𝑙𝑛 2𝜋 𝜎 2 } Logaritminė funkcija: 𝑙(𝑦; 𝜇, 𝜎 2 )= 𝑖=1 𝑛 − 𝑦 𝑖 −𝜇 2 2 𝜎 2 − 1 2 𝑙𝑛 2𝜋 𝜎 2 Logaritminė funkcija tiesinio modelio atveju: 𝑙(𝑦; 𝜇, 𝜎 2 )= 𝑖=1 𝑛 − 𝑦 𝑖 − 𝑗=1 𝑝 𝑋 𝑖𝑗 ∙ 𝛽 𝑗 2 2 𝜎 2 − 1 2 𝑙𝑛 2𝜋 𝜎 2 Mūsų atveju: 𝑙 ∗ 𝑦; 𝜇, 𝜎 2 =− (800− 𝛽 1 + 𝛽 3 ) 2 2 𝜎 2 − (500− 𝛽 1 ) 2 2 𝜎 2 − (400− 𝛽 2 + 𝛽 3 ) 2 2 𝜎 2 − (200− 𝛽 2 ) 2 2 𝜎 2 Gauname tas pačias lygtis ir sprendinius: 𝜕 𝑙 ∗ 𝜕 𝛽 1 =0→ 𝛽 1 + 𝛽 3 + 𝛽 1 =800+500=1300 𝜕 𝑙 ∗ 𝜕 𝛽 2 =0→ 𝛽 2 + 𝛽 3 + 𝛽 2 =400+200=600 𝜕 𝑙 ∗ 𝜕 𝛽 3 =0→ 𝛽 1 + 𝛽 3 + 𝛽 2 + 𝛽 3 =800+400=1200 𝛽 1 =525; 𝛽 2 =175; 𝛽 3 =250

Pavyzdys 2 Miestas Kaimas Vyras 800 500 Moteris 400 200 Nagrinėkime Puasono modelį Funkcija g(x) = ln(x), modelio paklaidos turi Puasono pasiskirstymą 𝐸 𝑌 =𝑔 −1 𝑋∙𝛽 = 𝑔 −1 ( 𝛽 1 + 𝛽 3 ) 𝑔 −1 ( 𝛽 1 ) 𝑔 −1 ( 𝛽 2 + 𝛽 3 ) 𝑔 −1 ( 𝛽 2 ) = 𝑒 𝛽 1 + 𝛽 3 𝑒 𝛽 1 𝑒 𝛽 2 + 𝛽 3 𝑒 𝛽 2 Puasono skirstinio tankio funkcija: 𝑓(𝑦; 𝜇)= 𝑒 −𝜇 𝜇 𝑦 /𝑦! Didžiausio tikėtinumo funkcijos logaritmas: 𝑙 𝑦; 𝜇 = 𝑖=1 𝑛 𝑙𝑛 𝑓( 𝑦 𝑖 ; 𝜇 𝑖 ) = 𝑖=1 𝑛 − 𝜇 𝑖 + 𝑦 𝑖 𝑙𝑛 𝜇 𝑖 − 𝑙𝑛 𝑦 𝑖 ! 𝑙 𝑦; 𝑒 𝑋∙𝛽 = 𝑖=1 𝑛 −𝑒𝑥𝑝⁡( 𝑗=1 𝑝 𝑋 𝑖𝑗 𝛽 𝑗 ) + 𝑦 𝑖 𝑗=1 𝑝 𝑋 𝑖𝑗 𝛽 𝑗 − 𝑙𝑛 𝑦 𝑖 ! 𝑙 𝑦; 𝜇 =− 𝑒 𝛽 1 + 𝛽 3 +800∙ 𝛽 1 + 𝛽 3 −𝑙𝑛 800! − 𝑒 𝛽 1 +500 ∙𝛽 1 −𝑙𝑛 500!− − 𝑒 𝛽 2 + 𝛽 3 +400∙ 𝛽 2 + 𝛽 3 −𝑙𝑛 400!− 𝑒 𝛽 2 +200 ∙𝛽 2 −𝑙𝑛 200!

𝑙 𝑦; 𝜇 =− 𝑒 𝛽 1 + 𝛽 3 +800∙ 𝛽 1 + 𝛽 3 − 𝑒 𝛽 1 +500∙ 𝛽 1 − Pavyzdys 2 Miestas Kaimas Vyras 800 500 Moteris 400 200 𝑙 𝑦; 𝜇 =− 𝑒 𝛽 1 + 𝛽 3 +800∙ 𝛽 1 + 𝛽 3 −𝑙𝑛 800! − 𝑒 𝛽 1 +500 ∙𝛽 1 −𝑙𝑛 500!− − 𝑒 𝛽 2 + 𝛽 3 +400∙ 𝛽 2 + 𝛽 3 −𝑙𝑛 400!− 𝑒 𝛽 2 +200∙ 𝛽 2 −𝑙𝑛 200! 𝑙 𝑦; 𝜇 =− 𝑒 𝛽 1 + 𝛽 3 +800∙ 𝛽 1 + 𝛽 3 − 𝑒 𝛽 1 +500∙ 𝛽 1 − − 𝑒 𝛽 2 + 𝛽 3 +400∙ 𝛽 2 + 𝛽 3 − 𝑒 𝛽 2 +200 ∙𝛽 2 𝜕 𝑙 ∗ 𝜕 𝛽 1 =0→ 𝑒 𝛽 1 ∙( 𝑒 𝛽 3 +1)=1300 𝜕 𝑙 ∗ 𝜕 𝛽 2 =0→ 𝑒 𝛽 2 ∙( 𝑒 𝛽 3 +1)=600 𝜕 𝑙 ∗ 𝜕 𝛽 3 =0→ 𝑒 𝛽 3 ∙( 𝑒 𝛽 1 + 𝑒 𝛽 2 )=1200 𝑒 𝛽 1 =479; 𝑒 𝛽 2 =221; 𝑒 𝛽 3 =1,71428571 → Miestas Kaimas Vyras 821,1 479,0 Moteris 378,9 221,1

Eksponentiniai skirstiniai (1/2) Normalusis ir Puasono skirstiniai priklauso eksponentinių skirstinių šeimai. Formaliai eksponentinė šeima aprašoma formule: 𝑓 𝑖 𝑦 𝑖 , 𝜃 𝑖 ,𝜙 =𝑒𝑥𝑝⁡{ 𝑦 𝑖 𝜃 𝑖 −𝑏 𝜃 𝑖 𝑎 𝑖 𝜙 +𝑐 𝑦 𝑖 ,𝜙 }, kur 𝑎 𝑖 𝜙 , 𝑏 𝜃 𝑖 ir 𝑐 𝑦 𝑖 ,𝜙 yra funkcijos; 𝜃 𝑖 - parametras susijęs su vidurkiu; 𝜙 yra skalės parametras susijęs su dispersija. Eksponentinė šeima turi dvi savybes: Skirstinys pilnai apibrėžiamas per vidurkį ir dispersiją 𝑌 𝑖 yra vidurkio funkcija: 𝑉𝑎𝑟(𝑌 𝑖 )= 𝜙 𝑉( 𝜇 𝑖 ) 𝜔 𝑖 , kur 𝑉 𝑥 yra dispersijos funkcija; 𝜙 - skalės parametras; 𝜔 𝑖 - i-tojo stebėjimo svorio konstanta Normalusis, Puasono, Gama, Binominis ir atvirkštinis Gauso yra eksponentiniai skirstiniai. Dispersijų funkcijos tokios: Normalusis 𝑉(𝑥) 1 Puasono 𝑥 Gama 𝑥 2 Binominis 𝑥(1−𝑥) Atvirkštinis Gauso 𝑥 3

Eksponentiniai skirstiniai (2/2) Apibendrinti tiesiniai modeliai reikalauja tik, kad būtų ryšio funkcija (link function) 𝑔 −1 𝜂 , kuri tenkintų kelias adityvumo savybes (adityvumą kovariacijomis). 𝜂=𝑋∙𝛽 𝜇= 𝑔 −1 𝜂 - diferencijuojama ir monotoniška Tipiniai pasirinkimai yra: ξ apibrėžia poslinkius (offsets) 𝜂=𝑋∙𝛽+ξ 𝐸 𝑌 =𝜇= 𝑔 −1 𝜂 = 𝑔 −1 𝑋∙𝛽+ξ Bendrai apibendrintuosius tiesinius modelius galime apibrėžti taip: 𝝁 𝒊 =𝑬 𝒀 𝒊 = 𝒈 −𝟏 𝜼 𝒊 =𝒈 −𝟏 𝒋 𝑿 𝒊𝒋 𝜷 𝒋 + 𝝃 𝒊 ; 𝜼 𝒊 vadinami prediktoriais 𝑽𝒂𝒓 𝒀 𝒊 = 𝝓 𝑽( 𝝁 𝒊 ) 𝝎 𝒊 Indikatorinė 𝑔(𝑥) 𝑥 𝑔 −1 (𝑥) 𝑥 Logoritminė 𝑙𝑛⁡(𝑥) 𝑒 𝑥 Logit 𝑙𝑛⁡(𝑥/(1−𝑥)) 𝑒 𝑥 (1+ 𝑒 𝑥 ) Atvirkštinė 1 𝑥

Siūlomi tipiniai modeliai Y Žalų dažnis Žalų skaičius Vidutinė žala Atnaujinimo rodikliai Ryšio funkcija g(x) ln(x) ln(x/(1-x)) Paklaidos Puasono Gama Binominis Skalės parametras ϕ 1 Apskaičiuojamas Dispersijos funkcija V(x) x x 2 x(1-x) Svoriai ω Sutarties trukmė Poslinkis ξ ln(Sutarties trukmė)

Prielaidos ir rezultatai (1/3) Dažniausiai naudojamas daugiklių (multiplikatyvinis) modelis. Funkcija g(x) = ln(x), modelio paklaidos turi Puasono pasiskirstymą: Tikėtina žala = Čia - pradinė konstanta. Pradinė grupė parenkama taip, kad išvengtume faktorių priklausomumo. Faktoriai, kurie gali būti naudojami įmokų apskaičiavime: Automobilio parametrai (darbinis tūris, galia, markė, modelis, amžius ir t.t.) Draudėjo vairavimo stažas Draudėjo amžius Miestas, regionas Drausmingumo kategorijos Naudojimo teritorija (-) Kiti TP valdytojai Sutarties trukmė Kiti Galiausiai pridedamos veiklos sąnaudos, kad gauti galutinę sutarties įmoką.

Prielaidos ir rezultatai (2/3) Grynosios įmokos metodas: E(P) = E(C) + veiklos sąnaudos Nuostolingumo metodas: CR = LR + ER Stochastinis modeliavimas, apibendrintieji tiesiniai modeliai Klausimai: Kaip nustatyti rizikos faktoriaus svarbą tarifų sistemoje? Kaip įvertinti rizikos faktorių tarpusavio priklausomybę? Kaip pasirinkti įmokos nustatymo pagrindą, kas iš tiesų charakterizuoja riziką (pvz.: draudimo suma ar markė ir modelis)? Kaip įvertinti naujo tarifo įtaką portfelio struktūrai ir kaip naują tarifą priims rinka?

Prielaidos ir rezultatai (3/3) Analizei turi būti pakankamai duomenų Vienfaktorės analizės metu sužiūrimos prielaidos, panašios mažos grupės sujungiamos Trumpalaikės sutartys perskaičiuojamos į metines Modeliuojama žala polisui. Prie gauto dydžio pridedamos veiklos sąnaudos: 𝐸 𝑃 = 𝐸(𝐶) 𝐿𝑅 Įmokos struktūra, atitinkanti 0 pelningumą, tokia: Draudiminis nuostolingumas = 55% Veiklos sąnaudos įskaitant tarpininkų komisą bei Biuro mokestį = 32% Žalų sureguliavimo kaštai = 5% IBNR = 5% Perdraudimo sąnaudos = 3%

Techninės detalės Reikia išsirinkti pradinę grupę, t.y. panaikinti visas priklausomybes Realiai gauname tokias matricas ir vektorius: Faktoriai Žalos Naudingi R kodai  > Faktoriai<-as.matrix(read.table('Faktoriai.txt',header=TRUE)) > Zalos<-as.matrix(read.table('Zalos.txt',header=TRUE)) > Modelis<-glm(Zalos~Faktoriai,family=poisson) Literatūra: A Practitioner‘s Guide to Generalized Linear Models, Towers Watson Nuoroda

Ačiū už dėmesį!