2016年2月16日火曜日

実験効果を調べたい場合は「t検定」と「分散分析」

要因・水準によって分析手法が異なる


その前に要因について説明します。

要因とは、データに影響を与えるものであり、我々がそう判断したものです。

実際に影響を与えているかを調べる分析が前提ですので、分析者や実験者が創造した影響力が要因になります。

植物の生育に影響を与える肥料
運動能力に影響を与えるトレーニング

水準とは、観測対象の枠組みです。実験で言えば条件に当たります。
植物の生育の条件
トレーニングの条件

一要因分析×2水準以下なら t検定が使えます


一要因×1水準

水準の効果(観測値の平均値)がある指定された値(帰無仮説)より大きいか(小さいか)?
⇒1標本の平均値の検定

一要因×2水準

2つの水準の効果(各水準における観測値の平均値)には差があるか?
⇒2標本の平均値の差の検定

では、二要因分析あるいは、一要因分析×3水準では検定が使えないのでしょうか?

二要因分析では、相互作用を考慮しなければなりません。

二要因分析では、

一要因の効果
二要因の効果
一要因と二要因の交互作用効果

一要因と二要因の交互作用効果を調べるには、分散分析が必要になります。

また、一要因3水準のt検定は、水準を1つ1つ調べることは出来ますが、要因が全てに影響している場合を想定していません。
例えば、3水準では、1水準と2水準を調べている時は、3水準目を無視しています。

分散分析とは?


分散分析の考え方
要因の影響力を分散に基づいて判断します。
分散は次の関係式を持っています。
測定値のばらつき=予測値のばらつき+誤差のばらつき

そこで、モデルの説明力として、「誤差のばらつき」に対して「予測値のばらつき」が大きいかで判断します。平方和は二乗という意味です。ばらつきですので、+-が存在するので二乗で消しています。

ばらつきで判断する


しかし、水準が増加するほど分散が大きくなるため修正として、平均平方和を用います。
予測値の平均平方和は、増加した水準分だけ値を下げるためます。

要因による平均平方和


同じく誤差平方和も、以下のようにして平均平方和にします。

誤差による平均平方和


最後に要因効果をF分布に照らして判断します。

F分布によって分散分析の結果を判断します

このF分布は、母集団において、水準平均に全く差がない時の動きを表しています。
つまり、分散分析で得たF値をF分布に照らすことで、水準平均に差があるかを判断します。

0 件のコメント:

コメントを投稿