データマイニングの基礎 第1章 データマイニング入門 その1
今日からまた少し系統の違う本として「データマイニングの基礎」を読むことにします。
- 作者: 元田浩,山口高平,津本周作,沼尾正行
- 出版社/メーカー: オーム社
- 発売日: 2006/12/01
- メディア: 単行本
- 購入: 2人 クリック: 46回
- この商品を含むブログ (16件) を見る
第1章はそもそもデータマイニングとはなにを指すのかといったあたりからです
- 情報の価値が高くなっている
- 量が質に変化する
- エキスパートシステムとの対比
- データマイニングではデータに内在する非明示的な知識を発掘、利用しようとする
- KDD (Knowledge Discovery in Database)
- 利用可能な知識をデータから発見する
- 機械学習との対比
- データマイニングのプロセス
- データの獲得、選択(データウェアハウシング、データを一括管理できるようにする)
- 前処理(ノイズ、異常値の除去、欠損補間、離散化/連続化)、変換(表形式にしたり、逆に構造化データにしたり)
- パターンの発見
- 解釈、評価
- 知識はその予測精度などよりも解釈に重きが置かれる。理解できない知識は使われない
- ここは前述の機械学習との対比と矛盾があるように思う。あくまで抽出したパターンが重要でモデル(解釈)が主人公ではなかったはずなのに、ここの記述では反対になっている
- 知識はその予測精度などよりも解釈に重きが置かれる。理解できない知識は使われない
- 目標の設定が重要