データマイニングの基礎 第5章 知識の精度評価 その3
かなり間があいて忘れてしまいましたが続き読みます。
- 分割表による解析
- データとモデルでの判定結果を true positive, true, negative, false positive, false negative に分類して指標を作る
- 精度(Precision) = true positive / (true positive + false positive) つまり陽判定したサンプルのうち正解した率
- 再現度(recall) = true positive / (true positive + false negative) つまり実際には陽なデータのうち正解した率
- Precision と Recall は trade-off の関係にある
- 相対危険度(ある要因を受けた群での発生率と受けなかった群での発生率の比)
- 寄与危険度(同上の差)
- オッズ比 - (true positive * true negativei) / (false positive * false negative)
- ROC 曲線
- 横軸に false positive rate, 縦軸に true positive rate
とりあえずリハビリでこのくらいに。