Üldistatud lineaarse mudeli kasutamine, näide
Toon järgnevalt samad näited, mis sai tehtud eelpoolkäsitletud meetoditega.
Regresioonanalüüs oligi juba lm abil tehtud .
Sagedustabeli analüüs logistilise mudeliga - samuti tehtud, glm abil ( family=binomial).
Vaatleme järvede andmestikus läbipaistvuse (normaaljaotusega)
Regresioonanalüüs oligi juba lm abil tehtud .
Sagedustabeli analüüs logistilise mudeliga - samuti tehtud, glm abil ( family=binomial).
Vaatleme järvede andmestikus läbipaistvuse (normaaljaotusega)
Andmed jarved_1.csv
glm_mudel=glm(LP~Jarv*aastaaeg*PH,family=gaussian) anova(glm_mudel,test="Chisq") Analysis of Deviance Table Model: gaussian, link: identity Response: LP Terms added sequentially (first to last) Df Deviance Resid. Df Resid. Dev Pr(>Chi) NULL 94 417.40 Jarv 2 262.155 92 155.24 < 2.2e-16 *** aastaaeg 2 12.987 90 142.25 0.0036642 ** PH 1 3.315 89 138.94 0.0906344 . Jarv:aastaaeg 4 26.089 85 112.85 0.0001567 *** Jarv:PH 2 2.829 83 110.02 0.2946483 aastaaeg:PH 2 13.368 81 96.65 0.0031086 ** Jarv:aastaaeg:PH 4 7.511 77 89.14 0.1655610 |
Lisame mudelisse kõikvõimalikud faktorid ja nende koosmõjud. Testime, millised mõjud on olulised. Eeldame normaaljaotust. Uuritav tunnus LP-läbipaistvus. Mõjud võetakse arvesse järjest. Üks võimalus mudeli valikul on järgnevast väljundist olulised välja korjata: oluline oluline oluline oluline |
Kuidas parimat mudelit välja otsida, on samuti keeruline probleem, seda eriti juhul, kui me ei tea täpselt, missugune mõju on individuaalne, aga milline kaasneb juba arvesse võetud faktoriga. Omavahel tugevalt seotud faktorid võivad pöörata, kui nad koos mudelisse võtta, kogu analüüsi pea peale. Seetõttu soovitatakse hoopis hakata järjest faktoreid juurde võtma, mitte nii, et võtame algul kõik, ja hakkame siis välja jätma.
Mudeli valik on väga lai teema, selle käsitlemiseks antud õpiobjekti juures mahtu ei jätku.
Ja nüüd viimane teema
Mudeli valik on väga lai teema, selle käsitlemiseks antud õpiobjekti juures mahtu ei jätku.
Ja nüüd viimane teema