Statistilise analüüsi meetodid
  • Avaleht
  • Õpiväljundid
  • Õpijuhend
  • Sissejuhatus
  • Hüpoteesid nii ja naa
  • Väheste väärtustega diskreetsed ja nominaalsed tunnused ja faktorid
    • Sagedustabeli analüüs
    • ANOVA (Näide1)
  • Pidev tunnus ja pidev faktor
    • Pidev_tun_test
    • Regressioonanalüüs
    • Aegrea analüüs
  • Pidev tunnus, binaarne või diskreetne faktor
    • T-test
    • ANOVA näiteid
  • Binaarsed tunnused
    • 2 X 2 sagedustabeli analüüs
    • Logistiline mudel 1
  • Üldistatud lineaarne mudel
    • Näide
  • Mitteparameetrilised testid
  • Andmefailid
  • Tagasiside "Analüüsimeetodid"

Dispersioonanalüüs ANOVA (ANalysis Of VAriance)

Teoorial pikemalt ei peatu, meetodi kohta on väga palju kirjandust, samuti on lugeda loengumaterjalides lühiülevaade.
Interneti otsingumootoris kasuta märksõna "Dispersioonanalüüs" või "ANOVA".
 Näiteandmed on samad, mis eelmisel leheküljel said antud, R-s sisestatud PDF fail andmed_sisse.pdf .
Meil on tööhüpotees, et vesiroose esineb rohkem seal, kus on rohkem suvilaid. 
Tunnus, mida uurime: meid huvitava taime ohtrus järves, hinnatud kolmepalli süsteemis (väärtused 0-3).
Faktor, mille mõju tahame testida:  elamute arv sama veekogu vahetus läheduses (väärtused 0-2)  
Faktor on arvuline järjestustunnus, kolme eri tasemega. Kuna ohtrus on nelja erineva võimaliku väärtusega, siis hajuvusel siinjuures nii suurt tähtsust olla ei saa, aga-keskmise hinnang koos usalduspiiridega on võimalik arvutada (analoogne näiteks hinnete keskmise ja muude järjestustunnustega, mis on antud arvulise hinnanguna) - ANOVA sobib.
m1<-aov(ohtrus~maju);summary(m1)
                  Df    Sum    Sq Mean    Sq           F value Pr(>F)  
maju          2   10.84        5.422    4.697       0.0112 *
Residuals   103 118.89   1.154                 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

print(model.tables(m1,"means"),digits=3) 
Tables of means
Grand mean
1.584906 
 maju     0        1       2
            1.17  1.62  1.95
TukeyHSD(m1)
  Tukey multiple comparisons of means
    95% family-wise confidence level
Fit: aov(formula = ohtrus ~ maju)
$maju
               diff                      lwr               upr           p adj
1-0       0.4462185 -0.1690070 1.0614440 0.2008735
2-0       0.7745174  0.1720762 1.3769585 0.0079438
2-1       0.3282989 -0.2786780 0.9352757 0.4061357   
ANOVA tellimine

F statistiku p-väärtus on väiksem kui 0.05, mis tähendab, et majade arvul on mõju ohtrusele.



Tellime keskmised, üldkeskmise ja iga majade arvu korral keskmise ohtruse.


2 maja korral on vesiroosi keskmine ohtrus kõige suurem.
Tellime paarikaupa võrdlused Tukey meetodiga.



1-0 tähendab: keskmine ohtrus 1 majaga  miinuse keskmine ilma majata
diff-erinevus, lwr ja upr - vahe usalduspiirid
 2 majaga ja elamuteta järvedes  erinevad keskmised ohtrused  oluliselt. 

                                                                                                                                                                                       Järgmine
Powered by Create your own unique website with customizable templates.