データマイニングの基礎 第3章 データマイニングの高度な手法 その4

クラスタリングの続きからです

  • 階層併合的クラスタリング(Agglomerative Hierarchical Clustering: AHC)
    • 合併したグループの距離(非類似度)または類似度の計算方法によって以下のように細分化される
    • 最短距離法
    • 最長距離法
    • 群間平均法
    • 重心法 (併合後にその重心を代表値とする)
    • Ward 法 (各点と重心との距離の二乗和を用いて非類似度を構成する → つまり「まとまりぐあい」を重視する)
  • K-means 法
    • クラスタ数はあらかじめ決まっている
    • 初期値として適当なクラスタ分割されていて、その重心との各点の距離を求めて各点を最近傍のクラスタに割り当てるという操作を繰り返して収束させる
  • Fuzzy C-means 法
    • K-means 法のクラスタ分割を重み付けした離散値としたもの