聚类算法汇总

聚类算法汇总

标签(空格分隔): 机器学习


作为无监督领域(unsupervised)一个太过famous的算法了,聚类(clustering)就是对大量未知标注的数据集,按照数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小. 然而,里面仍然有很多需要注意的地方,对于聚类本身,目前也有很多改进版本了,所以还是需要总结一下的。

相似度的度量

各种相似度的度量方式及其相关性见我的这篇博客

K-means算法

这个算法大家都熟,跟KNN是兄弟,简单实用易操作,它也是其他一些聚类算法的鼻祖。
具体的步骤为:
对于输入样本 D=x1,x2,x3,...,xm :

  1. 选择初始的K个class center μ1,μ2,...,μK ;
  2. 对于每个样本 xi ,将其标记为距离类别中心最近的类别,即: yi=argmin1jK||xiμj|| ;
  3. 将每个类别中心更新为隶属该类别的所有样本的均值:
    μj=1|cj|icjxi ;
    4.重复上述两步,直至算法收敛。
    收敛条件为:迭代次数/簇中心变化率/最小平方误差MSE(Minimum Squared Error)
    E=ki=1xCi||xμi||2</
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值