k means聚类算法_聚类算法之——K-Means算法

本文详细介绍了K-Means聚类算法,包括预备知识点如距离计算(欧式距离、曼哈顿距离、余弦距离)、算法步骤、聚类效果评价指标SSE以及如何在Python中使用sklearn库实现。还讨论了算法的优缺点、如何避免局部最优、选择K数量的策略以及适用场景。
摘要由CSDN通过智能技术生成

聚类算法属于无监督学习,它将相似的对象归到同一个簇中。K-Means算法是聚类算法中最常用到算法;

1. 预备知识点

距离计算

闵可夫斯基距离

equation?tex=x%3D%28x_1%2Cx_2%2C%5Cdots%2Cx_n%29%E5%92%8Cy%3D%28y_1%2Cy_2%2C%5Cdots%2Cy_n%29 之间的闵可夫斯基距离为
equation?tex=d%28x%2Cy%29%3D%28%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%7B%7Cx_i-y_i%7C%5Ep%7D%29%5E%5Cfrac%7B1%7D%7Bp%7D+%5Cquad+%E5%85%B6%E4%B8%ADp%5Cgeq1

欧式距离

equation?tex=x%3D%28x_1%2Cx_2%2C%5Cdots%2Cx_n%29%E5%92%8Cy%3D%28y_1%2Cy_2%2C%5Cdots%2Cy_n%29 之间的欧氏距离为:
equation?tex=%5Cbegin%7Baligned%7Dd%28x%2Cy%29%26%3D%5Csqrt%7B%28x_1-y_1%29%5E2%2B%28x_2-y_2%29%5E2%2B%5Cdots%2B%28x_n-y_n%29%5E2%7D%5C%5C%26%3D%5Csqrt%7B%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%7B%28x_i-y_i%29%5E2%7D%7D+%5Cend%7Baligned%7D+

曼哈顿距离(Manhattan Distance )

b9aab10b035b5fcf1e5987347b5fb4ca.png

图中红线代表曼哈顿距离,绿线代表欧式距离,也就是直线距离,而蓝色和黄色代表等价的曼哈顿距离。

曼哈顿距离:两点在南北方向上的距离加上在东西方向上的距离。

equation?tex=x%3D%28x_1%2Cx_2%2C%5Cdots%2Cx_n%29%E5%92%8Cy%3D%28y_1%2Cy_2%2C%5Cdots%2Cy_n%29 之间的曼哈顿
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值