Binaarsed tunnused, mistahes tüüpi faktorid
Antud juhul on tegemist selliste uuritavate tunnustega, mida võib nimetada "on/ei ole" tüüpi tunnusteks. Arvutamiseks on tunnuse väärtus teisendatud, tavaliselt 0-ei ole ja 1-on. Taolise tunnuse jaoks võib muidugi arvutada keskväärtusi mistahes faktorite eri tasemetel, need jäävad ikka 0 ja 1 vahele ja tähistavad tegelikut 1 esinemise sagedust.
Keerulisemaks läheb analüüs juhul, kui võimalikke mõjutavaid faktoreid on rohkem, siis tuleb appi võtta logistiline mudel, sest tavalise lineaarse mudeliga on väga kerge prognoosimisega (mis on tegelikult üks modelleerimise põhiülesandeid) 0-1 vahemikust välja sattuda.
0-1 tunnused on nii loendusandmete kui ka tihti protsentide tekkimise aluseks. Näiteks kui me vaatasime sagedustabelit, siis see tekkis nii, et loetakse kokku mitu korda valimis üks või teine väärtus esines (vastandit-ei esinenud- saab kaudselt arvutada, kui lahutame kõikide objektide arvust esinemiste oma maha).
Kokkuvõte.
1. Kui nii tunnus kui ka faktor on binaarsed, on testi aluseks on 2X2 sagedustabel. Testimaks, kas seos binaarsete tunnuste vahel on oluline, sobib hästi Fisheri test. See test hindab šansside suhet- vaata teooria osa loengus või Internetist;
2. binaarse tunnuse modelleerimine logistilise mudeliga, kui meil on 0-1 tunnus;
3. binoomjaotusega tunnuse modelleerimine logistilise mudeliga, kui meil on loendustulemused:tunnuseks kahetulbaline andmestik kujul "mitu korda leidus" - "mitu korda ei leidunud"
Keerulisemaks läheb analüüs juhul, kui võimalikke mõjutavaid faktoreid on rohkem, siis tuleb appi võtta logistiline mudel, sest tavalise lineaarse mudeliga on väga kerge prognoosimisega (mis on tegelikult üks modelleerimise põhiülesandeid) 0-1 vahemikust välja sattuda.
0-1 tunnused on nii loendusandmete kui ka tihti protsentide tekkimise aluseks. Näiteks kui me vaatasime sagedustabelit, siis see tekkis nii, et loetakse kokku mitu korda valimis üks või teine väärtus esines (vastandit-ei esinenud- saab kaudselt arvutada, kui lahutame kõikide objektide arvust esinemiste oma maha).
Kokkuvõte.
1. Kui nii tunnus kui ka faktor on binaarsed, on testi aluseks on 2X2 sagedustabel. Testimaks, kas seos binaarsete tunnuste vahel on oluline, sobib hästi Fisheri test. See test hindab šansside suhet- vaata teooria osa loengus või Internetist;
2. binaarse tunnuse modelleerimine logistilise mudeliga, kui meil on 0-1 tunnus;
3. binoomjaotusega tunnuse modelleerimine logistilise mudeliga, kui meil on loendustulemused:tunnuseks kahetulbaline andmestik kujul "mitu korda leidus" - "mitu korda ei leidunud"