Üldistatu lineaarsete mudelite kasutamine.
Üldistatud lineaarset mudelit (R protseduur glm)saab kasutada, kui meie uuritav tunnus kuulub eksponentsiaalsete jaotuste perre, on sellised jaotused, mille kohta on teada tihedus- ja jaotusfunktsioonid.
R-s võimalikud jaotused onbinomial(link = "logit")
gaussian(link = "identity")
Gamma(link = "inverse")
inverse.gaussian(link = "1/mu^2")
poisson(link = "log")
quasi(link = "identity", variance = "constant")
quasibinomial(link = "logit")
quasipoisson(link = "log")
Kuidas uuritava tunnuse või valimi jaotust ära tunda, ei ole sugugi lihtne üheselt kirja panna. Valimi keskväärtusel ja dispersioonil on siinjuures tähtis osa: on võimalik simuleerida (programmiliste vahenditega tekitada) andmeid kindlast jaotusest, kasutades mistahes teoreetilise jaotuse parameetreid, ja siis võrrelda, kas nende simuleeritud väärtuste jaotus on valimi omaga sarnane. Näiteks histogrammi abil, või jaotuste võrdlemise teste kasutades. 100% kindlust, kuidas valimi jaotust õige teoreetilise jaotusega lähendada, ei oska vist keegi anda.
Mudeliga alalüüsi tegemise idee on sama, mis regressioonmudeli või ANOVA korral oli. Lisaväärtus üldistatud mudelil lisaks jaotuse valimise võimalusele on see, et me saame faktoreid mudelisse lisada nii palju kui vaja ja võimalik (vabadusastmete mõttes) on. Faktorid võivad olla mistahes tüüpi, samuti saab lisada koosmõjude tellimise.
Lineaarse mudeli (R-s lm) ja üldistatud lineaarse mudeli (glm) erinevus: hindamise meetod, mis tähendab kasutaja jaoks seda, et kui lm korral arvutatakse mudeli headuse iseloomustamiseks determinatsioonikordaja R-ruut, siis glm korral tuleb vaadata Akaike kooskõlakordajat AIC. Mida väiksem AIC, seda paremini mudel algandmetega kooskõlas on.
Mudelite võrdlemisel tuleb nii ehk nii kasutada, korrektsuse tagamiseks, testimist, kas iga faktor mudelis on üldse vajalik.