第十四章:聚类方法
基本概念
聚类是根据样本之间的相似度或距离来将样本进行归类,不同的距离度量方式会影响最终的聚类效果,常用的距离或相似度有下列:
- 闵可夫斯基距离:欧式、曼哈顿距离、切比雪夫距离等
- 马哈拉诺比斯距离: d i j = [ ( x i − x j ) T S − 1 ( x i − x j ) ] 1 2 , d_{ij}=[(x_i-x_j)^TS^{-1}(x_i-x_j)]^{\frac{1}{2}}, dij=[(xi−xj)TS−1(xi−xj)]21,其中S为样本集合的协方差矩阵
- 相关系数: r i j = ∑ k = 1 m ( x k i − x i ‾ ) ( x k j − x j ‾ ) [ ∑ k = 1 m ( x k i − x i ‾ ) 2 ∑ k =