分散分析
出展
生物統計学3 の分散分析
- 最も詳しい式による説明
分散分析(Analysis of Variance)
分散分析は,ANOVA (Analysis of Variance) と略記されることもある.
分散分析は,複数の処理を同時に 行ったときに,処理効果を推定するための最も基本的な手法である.
データ全体の持つ情報は,
- 総平方和にまとめられているが,これを,
- 処理の分散成分(処理平均平方)と
- 誤差の分散成分(誤差平均平方)とに分離して,
- その大きさを比較することにより,処理の効果を見積もるものである.
因子と水準
経済学では価格や成長率,工学では作業時間や故障率,農学では収量や抵抗性 など,調査研究したい特性を形質(character)という.着目した形質に影響を 与えると考えられるもの,例えば,収量では品種,温度,施肥量などを要因ま たは因子(factor)という.要因の影響を調べるためいくつかの品種を用いたり, 施肥量に段階を設けたりするが,それを水準(level)という.
一元配置(one-way layout)
構造モデル
t 検定では,2つの処理平均の比較を行ったが,この節ではこれを拡張して, 複数の処理平均の比較を行う手法を考える.
いま,
水準の処理(treatment):: ,…, ,があり ,が得られたとする.- 処理
からの標本:: 平均 , 分散 の正規分布に従うと仮定する. , 処理効果もしくは,主効果(main effect)と言い, ,である.- 誤差項(error term)::
標本の構造モデル,
として表現すると,データの持つ構造が理解しやすくなる.
平方和分解
いま,処理
標本全体の持つ情報は,総平方和
のように誤差平方和
これは,積の項が
のように 0 となるから.
なお,誤差平方和を群内平方和(within groups sum ofsquares),処理平方 和を群間平方和(between groups sum of squares)と呼ぶことも多い.
平方和の期待値
個々の標本
のようになるので,誤差平方和
のように計算できる.
帰無仮説のもとでの平方和の比の分布
一元配置モデルにおける帰無仮説は,すべての処理効果がない,つまり,
である.
前節の平方和の期待値から,帰無仮説のもとで,
これらのカイ二乗分布をその自由度で割った比の
自由度
ここで,
一方,
帰無仮説のもとでは
分散分析表と F 検定
一元配置モデルの解析結果は,以下の分散分析表(ANOVA table)にまとめら れる.
変動因 | 自由度(df) | 平方和(S.S.) | 平均平方(M.S.) | F値 |
---|---|---|---|---|
変動因 | 自由度(df) | 平方和(S.S.) | 平均平方(M.S.) | F値 |
主効果 | ||||
誤 差 | ||||
全 体 |
この表から検定統計量 F 値が求められる.そして, 自由度
であるとき,帰無仮説を棄却すると,有意水準