Ryšio nustatymas Skaitmeniniai duomenys Kategoriniai duomenys Koreliacija paskirtis, išraiška, interpretacija Kategoriniai duomenys
Koreliacija Naudojama norint parodyti ryšį tarp dviejų kintamųjų Koreliacinės analizės paskirtis – išmatuoti tiesinio ryšio tarp dviejų kintamųjų stiprumą - Nagrinėja tik ryšio stiprumą - Nesutapatinama su priežastingumu
Taškinių (scatter) diagramų pavyzdžiai Tiesiniai ryšiai Kreiviniai ryšiai y y x x y y x x
Taškinių diagramų pavyzdžiai Stiprūs ryšiai Silpni ryšiai y x x y x x
Taškinių diagramų pavyzdžiai Ryšio nėra y x y
Koreliacijos koeficientas Nepriklauso nuo mato vieneto Tarp -1 ir 1 Kuo arčiau -1, tuo stipresnis neigiamas tiesinis ryšys Kuo arčiau 1, tuo stipresnis teigiamas tiesinis ryšys Arti 0, ryšys silpnas arba jo nėra
Koreliacijos koeficiento interpretavimas Laipsnis kuriuo taškai išsidėsto aplink tiesę Neigiamos reikšmės Aprašymas Teigiamos reikšmės 0.00 “nėra” 0.19 - -0.01 “labai silpnas” 0.01 – 0.19 -0.39 - -0.20 “silpnas” 0.20 - 0.39 -0.69 – -0.40 “vidutinis” 0.40 – 0.69 -0.89 - -0.70 “stiprus” 0.70 – 0.89 -0.99 - -0.90 “labai stiprus” 0.90 – 0.99 -1.00 Visiškai tikslus” 1.00
Pavyzdžiai r reikšmėms x x x r = -1 r = -0,6 r = 0 y y x x r = +0,3 r = +1
Koreliacijos koeficientų tipai Skaitmeniniams duomenims, normalaus skirstinio, n>20 - Pirsono (Pearson) Ranginiams duomenims, arba skaitmeniniams, jei nenormalus skirstinys arba mažai stebėjimų - Spirmano (Spearman) - Kendalo (Kendall)
Koreliacijos koeficiento apskaičiavimas Pirsono koreliacijos koeficientas: kur: r = imties koreliacijos koeficientas x = vieno kintamojo reikšmė y = kito (dažniau priklausomojo) kintamojo reikšmė
Apskaičiavimo pavyzdys Medžio aukštis Kamieno Diametras y x 35 8 49 9 27 7 33 6 60 13 21 45 11 51 12
Apskaičiavimo pavyzdys Medžio aukštis, y r = 0,886 → palyginti stiprus teigiamas tiesinis ryšys tarp x ir y Kamieno diametras, x
SKAITMENINIAI DUOMENYS
SKAITMENINIAI DUOMENYS
Spirmeno koreliacijos koeficientas
Kendalo koreliacijos koeficientas
Koreliacijos koeficiento naudojimo klaidos Netinkama, kai daro įtaką laikas, į ką neatsižvelgiama (mėsos suvartojimas ir mirtys nuo storosios žarnos vėžio) Jei imtis susiaurinama (pvz. amžius) Sumaišytos imtys (vyrų ir moterų riebalų proc. pagal amžių) Priežastingumas
Kategorinių duomenų ryšys Principas: - nustatyti ryšio stiprumą: RR (rizikų/paplitimų santykis), OR (šansų santykis) - įrodyti skirtumą /efektą (PI, P reikšmė)
Kiti ryšio matai χ2, jei n >>1000, beveik visada atmetama H0 Tarpusavio sutapimo rodiklis φ Julo asociacijos koeficientas Q Kontingencijos koeficientas C Kramero koeficientas V Sąlyginis prognozės indeksas λ (Gudmano, Kruskalo)
2X2 LENTELĖ 25 14 39 30 36 66 55 50 105 POŽIŪRIS Į KŪNO KULTŪRĄ NEMĖGSTA MĖGSTA Grupės TURI ANTSVORIO 25 14 39 NETURI ANTSVORIO 30 36 66 55 50 105
RYŠYS RR: Turi antsvorio = a/(a+b)=25/39=0,64 Neturi antsvorio =c/(c+d)=30/66=0,45 0,64/0,45=1,42 k. Rizikų skirtumas (absoliuti/atributinė rizika) AR=0,64-0,45=0,19 OR=ad/bc=2,1 χ2=3,4, tai P reikšmė...?
RYŠIO MATAI 25 14 39 30 36 66 55 50 105 POŽIŪRIS Į KŪNO KULTŪRĄ POŽIŪRIS Į KŪNO KULTŪRĄ NEMĖGSTA MĖGSTA Grupės TURI ANTSVORIO 25 14 39 NETURI ANTSVORIO 30 36 66 55 50 105
RYŠIO MATAI 39 66 105 POŽIŪRIS Į KŪNO KULTŪRĄ NEMĖGSTA MĖGSTA Grupės Tarpusavio sutapimo rodiklis φ=1 POŽIŪRIS Į KŪNO KULTŪRĄ NEMĖGSTA MĖGSTA Grupės TURI ANTSVORIO 39 NETURI ANTSVORIO 66 105
RYŠIO MATAI
Skirtumai Q geriau atskleidžia empirinį ryšį (antsvoris sąlygoja požiūrį, o ne atvirkščiai) φ teisingiau nusako dvipusį ryšį (veikia vienas kitą, pvz. plaukų ir akių spalva)
RYŠIO MATAI Kontingencijos koeficientas C Didesnės apimties lentelėms. Kramerio V koeficientas Keturlaukėms lentelėms Kramerio V koeficientas sutampa su φ koeficientu.
KITI RYŠIO MATAI Lambda (liambda, λ), Goodman and Kruscal’s tau (liambda modifikacija – Gudmano-Kruskalio tau) neapibrėžtumo koeficientas (uncertainty coefficient) Šie koeficientai skaičiuojami taip vadinamos proporcingo klaidos mažinimo koncepcijos pagrindu.