データマイニングの基礎 第4章 前処理・データ変換 その2

  • 属性選択
    • データ量の削減のために、使用するデータの削除(行の削除)、使用する属性の削除(列の削除)を行う
    • フィルタ法とラッパ法
    • フィルタ法
      • 探索法
        • 探索の方向で前向き探索(最も有効な属性から順に追加していく)と後向き探索(全属性がある状態から最も効かない属性を削っていく)にわかれる
        • 両方向探索 - 両方の向きを探索して先にみつかったものを解とする
        • ランダム探索 - ランダムなセットを繰り返し生成して最も良いものを選ぶ。選択肢がとても大きい時にはこの方法も
      • 探索の戦略
        • 完全探索
        • ヒューリスティック探索
          • 最良優先探索 - 未展開のノードを評価値の高い順に探索していく
          • ビーム探索 - 未展開のノードのうち評価値の上位数個を残す
          • 欲張り探索 - 未展開のノードのうち最大の評価値のものだけ残して探索する(ビーム探索の残す数==1の場合)
        • 非決定的探索 - ランダム探索