データマイニングの基礎 第5章 知識の精度評価 その3

かなり間があいて忘れてしまいましたが続き読みます。

  • 分割表による解析
    • データとモデルでの判定結果を true positive, true, negative, false positive, false negative に分類して指標を作る
    • 精度(Precision) = true positive / (true positive + false positive) つまり陽判定したサンプルのうち正解した率
    • 再現度(recall) = true positive / (true positive + false negative) つまり実際には陽なデータのうち正解した率
    • Precision と Recall は trade-off の関係にある
    • 相対危険度(ある要因を受けた群での発生率と受けなかった群での発生率の比)
    • 寄与危険度(同上の差)
    • オッズ比 - (true positive * true negativei) / (false positive * false negative)
  • ROC 曲線
    • 横軸に false positive rate, 縦軸に true positive rate

とりあえずリハビリでこのくらいに。