聚类算法整体总结

本文对聚类算法进行了全面总结,包括基于分割的K-Means算法,其快速收敛但对初始中心点敏感;Sequential Leader Clustering,无需设置K值,对数据进行一次性处理;以及基于模型的EM算法,适用于描述数据分布。此外,还提及了基于密度的DBSCAN算法,能处理噪声和不规则分布,且无需预设类别数量。
摘要由CSDN通过智能技术生成

聚类方法归类:划分法、基于模型、基于密度、层次法、基于网格

模型参数:需要求出来的目标

隐含参数:不需要求,但如果知道会有利于求出目标

基于分割的聚类

一、K-Means

算法步骤

1.随机初始化几个点(可随意设置)

2.将其余各点根据到初始点的距离,分配到这些点上,形成初始分类

3.找到每个类的中心点(到类内其它点距离均值最小的点),作为新的初始点

4.重复2、3步,直到中心点不再变化(或变化很小)

算法复杂度:O(tkn),t为迭代次数(一般5、6次),k为初始选取的点数(即分类数),n为数据集的规模

缺点:K-Means对只能处理分布简单的数据,对数据分布有要求;对噪声和outliner(离群点)敏感;对初始中心点敏感;

优点:收敛速度快

二、Sequential Leader Clustering

只处理一遍,不需要设置K值

1.设置一个阈值

2.来一个点,计算它与已有点的距离,小于阈值即归为一类。否则自立门户,形成新的一类

基于模型的聚类、基于密度的聚类

一、EM算法(期望最大化算法ExpectationMaximuzation),基于模型

基于模型的

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值