Ryšio nustatymas Skaitmeniniai duomenys Kategoriniai duomenys

Slides:



Advertisements
Panašios pateiktys
Laisvės ir kalnų šauksmas
Advertisements

“Ieškosiu Tavo veido...” pagal Isabel Guerra.
Lakštingala, čiulbanti 100 metų
Gėlių horoskopas MOTERIMS
Juozas Aputis (g. 1936) – rašytojas, bandantis surankioti ir savaip sudėlioti pasaulio grožį ir neįžvelgiamą jo gelmę reiškiančius žodžius. Parengė Vilniaus.
ATRASK DIEVO PAŠAUKIMĄ
III klasių viktorina Paruošė G.Baublienė ir L.Venskutė
Pateikties kopija:

Ryšio nustatymas Skaitmeniniai duomenys Kategoriniai duomenys Koreliacija paskirtis, išraiška, interpretacija Kategoriniai duomenys

Koreliacija Naudojama norint parodyti ryšį tarp dviejų kintamųjų Koreliacinės analizės paskirtis – išmatuoti tiesinio ryšio tarp dviejų kintamųjų stiprumą - Nagrinėja tik ryšio stiprumą - Nesutapatinama su priežastingumu

Taškinių (scatter) diagramų pavyzdžiai Tiesiniai ryšiai Kreiviniai ryšiai y y x x y y x x

Taškinių diagramų pavyzdžiai Stiprūs ryšiai Silpni ryšiai y x x y x x

Taškinių diagramų pavyzdžiai Ryšio nėra y x y

Koreliacijos koeficientas Nepriklauso nuo mato vieneto Tarp -1 ir 1 Kuo arčiau -1, tuo stipresnis neigiamas tiesinis ryšys Kuo arčiau 1, tuo stipresnis teigiamas tiesinis ryšys Arti 0, ryšys silpnas arba jo nėra

Koreliacijos koeficiento interpretavimas Laipsnis kuriuo taškai išsidėsto aplink tiesę Neigiamos reikšmės Aprašymas Teigiamos reikšmės 0.00 “nėra” 0.19 - -0.01 “labai silpnas” 0.01 – 0.19 -0.39 - -0.20 “silpnas” 0.20 - 0.39 -0.69 – -0.40 “vidutinis” 0.40 – 0.69 -0.89 - -0.70 “stiprus” 0.70 – 0.89 -0.99 - -0.90 “labai stiprus” 0.90 – 0.99 -1.00 Visiškai tikslus” 1.00

Pavyzdžiai r reikšmėms x x x r = -1 r = -0,6 r = 0 y y x x r = +0,3 r = +1

Koreliacijos koeficientų tipai Skaitmeniniams duomenims, normalaus skirstinio, n>20 - Pirsono (Pearson) Ranginiams duomenims, arba skaitmeniniams, jei nenormalus skirstinys arba mažai stebėjimų - Spirmano (Spearman) - Kendalo (Kendall)

Koreliacijos koeficiento apskaičiavimas Pirsono koreliacijos koeficientas: kur: r = imties koreliacijos koeficientas x = vieno kintamojo reikšmė y = kito (dažniau priklausomojo) kintamojo reikšmė

Apskaičiavimo pavyzdys Medžio aukštis Kamieno Diametras y x 35 8 49 9 27 7 33 6 60 13 21 45 11 51 12

Apskaičiavimo pavyzdys Medžio aukštis, y r = 0,886 → palyginti stiprus teigiamas tiesinis ryšys tarp x ir y Kamieno diametras, x

SKAITMENINIAI DUOMENYS

SKAITMENINIAI DUOMENYS

Spirmeno koreliacijos koeficientas  

Kendalo koreliacijos koeficientas  

Koreliacijos koeficiento naudojimo klaidos Netinkama, kai daro įtaką laikas, į ką neatsižvelgiama (mėsos suvartojimas ir mirtys nuo storosios žarnos vėžio) Jei imtis susiaurinama (pvz. amžius) Sumaišytos imtys (vyrų ir moterų riebalų proc. pagal amžių) Priežastingumas

Kategorinių duomenų ryšys Principas: - nustatyti ryšio stiprumą: RR (rizikų/paplitimų santykis), OR (šansų santykis) - įrodyti skirtumą /efektą (PI, P reikšmė)

Kiti ryšio matai χ2, jei n >>1000, beveik visada atmetama H0 Tarpusavio sutapimo rodiklis φ Julo asociacijos koeficientas Q Kontingencijos koeficientas C Kramero koeficientas V Sąlyginis prognozės indeksas λ (Gudmano, Kruskalo)

2X2 LENTELĖ 25 14 39 30 36 66 55 50 105 POŽIŪRIS Į KŪNO KULTŪRĄ NEMĖGSTA MĖGSTA Grupės TURI ANTSVORIO 25 14 39 NETURI ANTSVORIO 30 36 66 55 50 105

RYŠYS RR: Turi antsvorio = a/(a+b)=25/39=0,64 Neturi antsvorio =c/(c+d)=30/66=0,45 0,64/0,45=1,42 k. Rizikų skirtumas (absoliuti/atributinė rizika) AR=0,64-0,45=0,19 OR=ad/bc=2,1 χ2=3,4, tai P reikšmė...?

RYŠIO MATAI 25 14 39 30 36 66 55 50 105 POŽIŪRIS Į KŪNO KULTŪRĄ   POŽIŪRIS Į KŪNO KULTŪRĄ NEMĖGSTA MĖGSTA Grupės TURI ANTSVORIO 25 14 39 NETURI ANTSVORIO 30 36 66 55 50 105

RYŠIO MATAI 39 66 105 POŽIŪRIS Į KŪNO KULTŪRĄ NEMĖGSTA MĖGSTA Grupės Tarpusavio sutapimo rodiklis φ=1 POŽIŪRIS Į KŪNO KULTŪRĄ NEMĖGSTA MĖGSTA Grupės TURI ANTSVORIO 39 NETURI ANTSVORIO 66 105

RYŠIO MATAI  

Skirtumai Q geriau atskleidžia empirinį ryšį (antsvoris sąlygoja požiūrį, o ne atvirkščiai) φ teisingiau nusako dvipusį ryšį (veikia vienas kitą, pvz. plaukų ir akių spalva)

RYŠIO MATAI Kontingencijos koeficientas C Didesnės apimties lentelėms. Kramerio V koeficientas Keturlaukėms lentelėms Kramerio V koeficientas sutampa su φ koeficientu.

KITI RYŠIO MATAI Lambda (liambda, λ), Goodman and Kruscal’s tau (liambda modifikacija – Gudmano-Kruskalio tau) neapibrėžtumo koeficientas (uncertainty coefficient) Šie koeficientai skaičiuojami taip vadinamos proporcingo klaidos mažinimo koncepcijos pagrindu.