Statistilise analüüsi meetodid
  • Avaleht
  • Õpiväljundid
  • Õpijuhend
  • Sissejuhatus
  • Hüpoteesid nii ja naa
  • Väheste väärtustega diskreetsed ja nominaalsed tunnused ja faktorid
    • Sagedustabeli analüüs
    • ANOVA (Näide1)
  • Pidev tunnus ja pidev faktor
    • Pidev_tun_test
    • Regressioonanalüüs
    • Aegrea analüüs
  • Pidev tunnus, binaarne või diskreetne faktor
    • T-test
    • ANOVA näiteid
  • Binaarsed tunnused
    • 2 X 2 sagedustabeli analüüs
    • Logistiline mudel 1
  • Üldistatud lineaarne mudel
    • Näide
  • Mitteparameetrilised testid
  • Andmefailid
  • Tagasiside "Analüüsimeetodid"

ANOVA näiteid

 
1. Andmed peipsi_zpl.csv, Peipsi fosfori andmete põhjal. Vaatame, kas järveosa on oluline faktor fosfori keskmise sisalduse jaoks.Kuna Näide 1 korral sai kommentaaridega kõik läbi tehtud, siis annan siinkohal ainult tellimise ja väljatrüki.

ANOVA=aov(PTOT~Osa);summary(ANOVA);TukeyHSD(ANOVA);print(model.tables(ANOVA,"means"),digits=3)

            Df Sum Sq Mean Sq F value   Pr(>F)   
Osa          1  22274   22274   29.51 3.99e-06 ***
  Tukey multiple comparisons of means
    95% family-wise confidence level
$Osa                                        diff                    lwr               upr            p adj
Suurjärv-Lämmijärv            -48.42105   -66.49768    -30.34443   4e-06
Tables of means
Grand mean  73.73684
Lämmijärv  Suurjärv    
     97.9      49.5           SIIN ON JÄRVEOSADE KESKMISED - vastuseks eelneva lehe küsimusele! 


Võrdle, mis vahe oli äsjatehtud ANOVA ja T-testi tulemuste vahel? Kas erinevus üldkogumis sai mõlema korral tõestatud? 

Järgnev näide on parem ainult ANOVA-ga teha, sest kui faktoril on üle 2 taseme, siis mitme t-testiga kontrollimine nõuab Bonferroni paranduse kasutamist (loeng) ja tulemustest on tülikam ülevaadet saada.

2. NB! UUED ANDMED:  jarved_1.csv. 
Meil on kolme järve pH mõõtmised, tehtud sõltumatult, kuid võimalikult sarnastel tingimustel (muidu ei saaks jälle ANOVAt kasutada) - faktor aastaaeg, millel on 3 taset kevad, suvi ja sügis.
Tahame teada, kas pH taset mõjutavad järv ja sesoonsus, ehk on oluline ka nende koosmõju?
H0- pH on igal pool ühesugune.
H1- pH erineb vähemalt ühel järvel, või ühel aastaajal.
Koosmõju testimise H1 väidab, et vähemalt ühes järves on pH mingil aastaajal erinev teise järve pH-st samal aastajal.
mudel0=aov(PH~Jarv);summary(mudel0)
                       Df Sum  Sq Mean Sq F value    Pr(>F)    
Jarv                2  97.85         48.92      806.1    <2e-16 ***
Residuals   92   5.58           0.06                 
print(model.tables(mudel0,"means"),digits=2) 
Tables of means
Grand mean      
7.630421 
 Jarv 
    J1297     J653    J932
        6             8.2       8.4
rep   27.0      42.0   26.0

TukeyHSD(mudel0)
  Tukey multiple comparisons of means
    95% family-wise confidence level
Fit: aov(formula = PH ~ Jarv)
$Jarv
                diff       lwr       upr     p adj
J653-J1297 2.1828571 2.0380918 2.3276225 0.0000000
J932-J1297 2.3458974 2.1846414 2.5071534 0.0000000
J932-J653  0.1630403 0.0165902 0.3094904 0.0252933

mudel1=aov(PH~Jarv*kuu);summary(mudel1)
                      Df    SumSq  Mean Sq    F value          Pr(>F)    
Jarv               2     97.85      48.92           870.564      <2e-16 ***
aastaaeg     2       0.27        0.14           2.439             0.0933 .  
Jarv:aastaaeg  4     0.48     0.12           2.119             0.0853 .  
Residuals       86     4.83    0.06                   

anova(mudel0,mudel1,test="Chisq")    
Analysis of Variance Table
Model 1: PH ~ Jarv
Model 2: PH ~ Jarv * aastaaeg
  Res.Df    RSS         Df   Sum of Sq     Pr(>Chi)  
1     92       5.5836                        
2     86       4.8331     6      0.75049       0.03774 *


Kõige lihtsam mudel järve mõju kontrollimiseks
H1 : järvedes on pH erinev
Tõepoolest, nii see on p<0.05

Vaatame pH keskmisi 





Valimi põhjal arvutatud keskmised on erinevad

Tellime paarikaupa võrdlused 





Järv 1297 erineb teistest oluliselt

Järv 932 ja 653 ei erine
Tellime koosmõjuga mudeli

Järve mõju on oluline
Aastaaeg pole oluline
Koosmõju  p-väärtus on väiksem kui 0.1;

Korrektsuse mõttes võiksime üle kontrollida, kas koosmõjuga mudel erineb ilma koosmõjuta mudelit oluliselt?

Mudelite jääkide ruutude keskväärtuste võrdlused näitavad, et jah, koosmõjul siiski on oluline efekt 
Tulemus: Järve mõju on oluline, kuid ka aastaajal on pH keskväärtusele mingisugune mõju olemas. 
Kuidas seda mõju täpsemalt välja selgitada?

Proovi ise vastus leida!
Arvuta keskväärtused (kasuta ülaltoodud
print(...) käsku; tee mudel1 jaoks Tukey võrdlused ning vaata koosmõju graafikul.
interaction.plot(aastaaeg,Jarv,PH)
Kontrolli(PDF)                                                                                                                      
                                                                                                                                                     Järgmine teema
Powered by Create your own unique website with customizable templates.