Mean Shift 聚类

算法原理

Mean shift 算法是基于核密度估计的爬山算法,可用于聚类、图像分割等。
在这里插入图片描述
样本点集:上图中的实心点,n个样本点yi,i=1,2,…,n
区域圆心:蓝色空心圆x
感兴趣区域Sh:蓝色圆形区域,以x为圆心,h为半径的圆形内部。表达式为
在这里插入图片描述
Mean Shift向量:从蓝色空心圆到黄色空心圆的偏移向量,表达式为
在这里插入图片描述
三维高斯核概率密度分布如下图所示
在这里插入图片描述
高斯核密度分布等高线图如下图所示
在这里插入图片描述
Mean Shift聚类的过程相当于爬山的过程,所有点都爬向最近的山顶,即等高线的中心,如下图所示
在这里插入图片描述
聚类中心的更新沿着概率密度梯度方向,更新后的中心位置为
在这里插入图片描述
样本集中每个点的类别确定方式:类别中心位置更新时记录邻域内的点及其被每个类别访问的次数次数,样本点属于访问其次数最多的类别

算法的优缺点

优点:
不需要给出类别个数,类别个数取决于数据分布
带宽的选择可以基于领域知识
缺点:
方法复杂度较高,O(N^2),不适合大规模数据集

写博客的目的是学习的总结和知识的共享,如有侵权,请与我联系,我将尽快处理
参考链接如下
https://blog.csdn.net/hjimce/article/details/45718593
https://spin.atomicobject.com/2015/05/26/mean-shift-clustering/
https://blog.csdn.net/liangzuojiayi/article/details/78152180
https://blog.csdn.net/unixtch/article/details/78556499

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值