データマイニングの基礎第5章知識の精度評価その3

かなり間があいて忘れてしまいましたが続き読みます。分割表による解析データとモデルでの判定結果を true positive, true, negative, false positive, false negative に分類して指標を作る精度(Precision) = true positive / (true positive + false po…

2012-10-20

データマイニングの基礎第5章知識の精度評価その2

夜だと週末も読めます。引き続き学習したモデルの評価方法についての話題です統計学的検定帰無仮説 - 示したい仮説の否定。これを否定することで示したい仮説を採択したい。背理法みたいですね対立仮説 - 示したい仮説有意水準 - 帰無仮説が成立する確率…

2012-10-18

データマイニングの基礎第5章知識の精度評価その1

なかなか夜に読むのは捗らないです。学習したモデルの評価する方法についての話題です誤差評価統計的モデルの推定量の性質不偏性推定量の期待値が母集団の値に一致する(不偏推定量) 一致性標本数が大きくなるにつれて母集団の真の値に漸近していく有効…

2012-10-10

データマイニングの基礎第4章前処理・データ変換その5

訳あってしばらく夜に読書するようにします。属性構築元の属性を組み合わせて「帰納的に」新しい属性を作る「帰納的に」というのはあらかじめ準備したオペレータで属性値を組み合わせて変換することらしい。帰納的? 構築オペレータとしては数値属性は大小…

2012-10-04

データマイニングの基礎第4章前処理・データ変換その4

属性選択アルゴリズムの実例 Focus 前向き探索(属性を追加していく) 不整合度を指標にする整合性を保持できる(不整合度==0)な最小の属性集合を求める連続数値を扱えない。ノイズに弱い Relief ニアミス(その属性距離最小のデータ間でクラスが違う)を区別で…

2012-10-03

データマイニングの基礎第4章前処理・データ変換その3

属性選択の評価基準ラッパ法は学習結果の精度そのものを基準にするフィルタ法では事前にわかる基準を指標に属性の「良さ」属性値をもつデータ数が少ないほうが良い -- ここ(p.135)多分 typo がありますね。予測精度ベイズの分類器を用いる(一例として)…

2012-10-02

データマイニングの基礎第4章前処理・データ変換その2

属性選択データ量の削減のために、使用するデータの削除(行の削除)、使用する属性の削除(列の削除)を行うフィルタ法とラッパ法ラッパ法は学習アルゴリズム自体を用いて評価するので遅いフィルタ法探索法探索の方向で前向き探索(最も有効な属性から順に…

2012-10-01

データマイニングの基礎第4章前処理・データ変換その1

今日から第4章に入ります。数値属性の離散化数値を区間に分割してグルーブ化するシンボルを対象とする手法で数値属性を扱うためには離散化が必要分割が粗すぎると情報が失われるし、細かすぎると1つの区間のデータが少なくなってしまうのでうまい分割が…

毎朝30分読書会

2012-10-01から1ヶ月間の記事一覧