聚类基本概念
相似度或距离
- 相似度或距离:
聚类的核心是相似度或距离的定义,它将直接影响到聚类的结果- 闵可夫斯基距离
d i j = ( ∑ k = 1 m ∣ x k i − x k j ∣ ) 1 p d_{ij}=(\sum\limits_{k=1}^m|x_{ki}-x_{kj}|)^{\frac{1}{p}} dij=(k=1∑m∣xki−xkj∣)p1
p = 2 时 偶 啦 距 离 p=2时偶啦距离 p=2时偶啦距离
p = 1 时 曼 哈 顿 距 离 p=1时曼哈顿距离 p=1时曼哈顿距离
p = ∞ 时 为 切 比 雪 夫 距 离 p=\infty时为切比雪夫距离 p=∞时为切比雪夫距离 - 马哈拉诺比斯距离
d i j = [ ( x i − x j ) S − 1 ( x i − x j ) ] , 其 中 S − 1 为 协 方 差 矩 阵 d_{ij}=[(x_i-x_j)S^{-1}(x_i-x_j)],其中S^{-1}为协方差矩阵 dij=[(xi−xj)S−1(xi−xj)],其中S−1为协方差矩阵 - 相关系数
r i j = ∑ k = 1 m ( x k i − x ^ i ) ( x k j − x ^ j ) [ ∑ k = 1 n ( x k i − x ^ i ) 2 ∑ k = 1 m ( x k j − x ^ j ) 2 ] 1 2 r_{ij}=\frac{\sum\limits_{k=1}^m(x_{ki}-\hat{x}_i)(x_{kj}-\hat{x}_j)}{[\sum\limits_{k=1}^n(x_{ki}-\hat{x}_i)^2\sum\limits_{k=1}^m(x_{kj}-\hat{x}_j)^2]^{\frac{1}{2}}} rij=[k=1∑n(xki−x^i)2k=1∑m(xkj−x^j)2]21k=1∑m(xki−x^i)(xkj−x^
- 闵可夫斯基距离