データマイニングの基礎 第5章 知識の精度評価 その4
- 多重比較
- 検定を繰り返し行なうとどれかの仮説が棄却される可能性がたかまる(何度もやってるとどこかで間違う可能性も高くなるということ)
- 全体の有意水準を調節するための手法
- 比較したい群から全ての要素ひとつひとつを取る( 一元配置分散分析)、全ての対(2つのペア)を考える(Tukey の方法)、全ての組み合わせ(mC2)を考える(Dunnett の方法)などの方法がありえる
- それぞれの群の平均値の差と平均値の差の標準誤差の比で検定値を求める
- 最小記述長(MDLP)
かなり駆け足でよく理解していないところも多いですが、これで第5章は終了。最後の第6章を残すのみです。第6章は事例集などぐっと読み物っぽくなっているようなのでさらりと読めそうです。またそろそろ次の本を決めないと。