ANOVA näiteid
1. Andmed peipsi_zpl.csv, Peipsi fosfori andmete põhjal. Vaatame, kas järveosa on oluline faktor fosfori keskmise sisalduse jaoks.Kuna Näide 1 korral sai kommentaaridega kõik läbi tehtud, siis annan siinkohal ainult tellimise ja väljatrüki.
ANOVA=aov(PTOT~Osa);summary(ANOVA);TukeyHSD(ANOVA);print(model.tables(ANOVA,"means"),digits=3)
Df Sum Sq Mean Sq F value Pr(>F)
Osa 1 22274 22274 29.51 3.99e-06 ***
Tukey multiple comparisons of means
95% family-wise confidence level
$Osa diff lwr upr p adj
Suurjärv-Lämmijärv -48.42105 -66.49768 -30.34443 4e-06
Tables of means
Grand mean 73.73684
Lämmijärv Suurjärv
97.9 49.5 SIIN ON JÄRVEOSADE KESKMISED - vastuseks eelneva lehe küsimusele!
Võrdle, mis vahe oli äsjatehtud ANOVA ja T-testi tulemuste vahel? Kas erinevus üldkogumis sai mõlema korral tõestatud?
Järgnev näide on parem ainult ANOVA-ga teha, sest kui faktoril on üle 2 taseme, siis mitme t-testiga kontrollimine nõuab Bonferroni paranduse kasutamist (loeng) ja tulemustest on tülikam ülevaadet saada.
2. NB! UUED ANDMED: jarved_1.csv.
Meil on kolme järve pH mõõtmised, tehtud sõltumatult, kuid võimalikult sarnastel tingimustel (muidu ei saaks jälle ANOVAt kasutada) - faktor aastaaeg, millel on 3 taset kevad, suvi ja sügis.
Tahame teada, kas pH taset mõjutavad järv ja sesoonsus, ehk on oluline ka nende koosmõju?
H0- pH on igal pool ühesugune.
H1- pH erineb vähemalt ühel järvel, või ühel aastaajal.
Koosmõju testimise H1 väidab, et vähemalt ühes järves on pH mingil aastaajal erinev teise järve pH-st samal aastajal.
mudel0=aov(PH~Jarv);summary(mudel0)
Df Sum Sq Mean Sq F value Pr(>F) Jarv 2 97.85 48.92 806.1 <2e-16 *** Residuals 92 5.58 0.06 print(model.tables(mudel0,"means"),digits=2) Tables of means Grand mean 7.630421 Jarv J1297 J653 J932 6 8.2 8.4 rep 27.0 42.0 26.0 TukeyHSD(mudel0) Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = PH ~ Jarv) $Jarv diff lwr upr p adj J653-J1297 2.1828571 2.0380918 2.3276225 0.0000000 J932-J1297 2.3458974 2.1846414 2.5071534 0.0000000 J932-J653 0.1630403 0.0165902 0.3094904 0.0252933 mudel1=aov(PH~Jarv*kuu);summary(mudel1) Df SumSq Mean Sq F value Pr(>F) Jarv 2 97.85 48.92 870.564 <2e-16 *** aastaaeg 2 0.27 0.14 2.439 0.0933 . Jarv:aastaaeg 4 0.48 0.12 2.119 0.0853 . Residuals 86 4.83 0.06 anova(mudel0,mudel1,test="Chisq") Analysis of Variance Table Model 1: PH ~ Jarv Model 2: PH ~ Jarv * aastaaeg Res.Df RSS Df Sum of Sq Pr(>Chi) 1 92 5.5836 2 86 4.8331 6 0.75049 0.03774 * |
Kõige lihtsam mudel järve mõju kontrollimiseks
H1 : järvedes on pH erinev Tõepoolest, nii see on p<0.05 Vaatame pH keskmisi Valimi põhjal arvutatud keskmised on erinevad Tellime paarikaupa võrdlused Järv 1297 erineb teistest oluliselt Järv 932 ja 653 ei erine Tellime koosmõjuga mudeli Järve mõju on oluline Aastaaeg pole oluline Koosmõju p-väärtus on väiksem kui 0.1; Korrektsuse mõttes võiksime üle kontrollida, kas koosmõjuga mudel erineb ilma koosmõjuta mudelit oluliselt? Mudelite jääkide ruutude keskväärtuste võrdlused näitavad, et jah, koosmõjul siiski on oluline efekt |
Tulemus: Järve mõju on oluline, kuid ka aastaajal on pH keskväärtusele mingisugune mõju olemas.
Kuidas seda mõju täpsemalt välja selgitada?
Proovi ise vastus leida!
Arvuta keskväärtused (kasuta ülaltoodud print(...) käsku; tee mudel1 jaoks Tukey võrdlused ning vaata koosmõju graafikul.
interaction.plot(aastaaeg,Jarv,PH)
Kuidas seda mõju täpsemalt välja selgitada?
Proovi ise vastus leida!
Arvuta keskväärtused (kasuta ülaltoodud print(...) käsku; tee mudel1 jaoks Tukey võrdlused ning vaata koosmõju graafikul.
interaction.plot(aastaaeg,Jarv,PH)