聚类k-means/k-means++/fcm学习笔记

本文介绍了无监督学习中的聚类算法,包括k-means、k-means++和FCM。k-means通过迭代找到数据的最佳划分,k-means++在初始中心点选择上做了改进,降低了陷入局部最优的风险。而FCM则是一种软聚类方法,允许数据点同时属于多个类别。这些算法在文档分类、用户行为分析等领域有广泛应用。
摘要由CSDN通过智能技术生成

聚类主要是一种无监督学习,用来发现未标注数据的隐藏结构,主要是用来给数据分组,聚类算法一般有硬聚类(k-means,k-means++)和软聚类FCM(fuzzy c-means)。聚类目前广泛应用于文档,音乐,电影的分组,以及基于用户的行为对用户分组等。聚类一般有如下分类,基于层级(hierarchical)的聚类,基于密度(density-based)的聚类还有基于原型(prototype-based)的聚类。



k-means实现思路:
1. 随机从数据集中选择k个中心点
2. 对于数据集中的每一条数据,比较与k个中心点的距离,然后把当前数据分配给最近的中心点
3. 重新计算数据集中k个中心点
4. 重复第二步和第三步,只到中心点的位置变化不变或者变化在指定的范围内或者迭代次数满足设定的目标。
比较与中心点的距离一般采用的是欧式距离,k-means可能会选择到最差的结果,需要多跑几次,而且每次跑的结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值