《统计学习方法》（第十四章）——聚类方法

最新推荐文章于 2022-06-19 14:25:58 发布

mkopvec

最新推荐文章于 2022-06-19 14:25:58 发布

阅读量747

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/mkopvec/article/details/103866379

版权

                    
                        
                    
                    聚类基本概念 
相似度或距离 
相似度或距离:
    聚类的核心是相似度或距离的定义，它将直接影响到聚类的结果 
  闵可夫斯基距离
  d i j = ( ∑ k = 1 m ∣ x k i − x k j ∣ ) 1 p d_{ij}=(\sum\limits_{k=1}^m|x_{ki}-x_{kj}|)^{\frac{1}{p}} dij​=(k=1∑m​∣xki​−xkj​∣)p1​
  p = 2 时 偶 啦 距 离 p=2时偶啦距离 p=2时偶啦距离
  p = 1 时 曼 哈 顿 距 离 p=1时曼哈顿距离 p=1时曼哈顿距离
  p = ∞ 时 为 切 比 雪 夫 距 离 p=\infty时为切比雪夫距离 p=∞时为切比雪夫距离
马哈拉诺比斯距离
  d i j = [ ( x i − x j ) S − 1 ( x i − x j ) ] , 其 中 S − 1 为 协 方 差 矩 阵 d_{ij}=[(x_i-x_j)S^{-1}(x_i-x_j)],其中S^{-1}为协方差矩阵 dij​=[(xi​−xj​)S−1(xi​−xj​)],其中S−1为协方差矩阵
相关系数
  r i j = ∑ k = 1 m ( x k i − x ^ i ) ( x k j − x ^ j ) [ ∑ k = 1 n ( x k i − x ^ i ) 2 ∑ k = 1 m ( x k j − x ^ j ) 2 ] 1 2 r_{ij}=\frac{\sum\limits_{k=1}^m(x_{ki}-\hat{x}_i)(x_{kj}-\hat{x}_j)}{[\sum\limits_{k=1}^n(x_{ki}-\hat{x}_i)^2\sum\limits_{k=1}^m(x_{kj}-\hat{x}_j)^2]^{\frac{1}{2}}} rij​=[k=1∑n​(xki​−x^i​)2k=1∑m​(xkj​−x^j​)2]21​k=1∑m​(xki​−x^i​)(xkj​−x^