データマイニングの基礎 第4章 前処理・データ変換 その5

訳あってしばらく夜に読書するようにします。

  • 属性構築
    • 元の属性を組み合わせて「帰納的に」新しい属性を作る
    • 帰納的に」というのはあらかじめ準備したオペレータで属性値を組み合わせて変換することらしい。帰納的?
    • 構築オペレータとしては数値属性は大小比較、加算、減算など、論理値属性は and, or, not など
    • 属性の構築手順
  • 事例選択
    • データ集合から利用するデータを抽出、または利用しないデータを除外する。大きすぎるデータセットを利用可能なサイズに絞る意図と、データの品質を高めるため
    • 単純ランダムサンプリング
    • 非復元ランダムサンプリング
    • 復元ランダムサンプリング
    • 層別ランダムサンプリング
    • 適応サンプリング

だいぶはしょっていますが、これで第4章は終わります。