聚类k-means/k-means++/fcm学习笔记

最新推荐文章于 2024-08-14 00:10:28 发布

vs412237401

最新推荐文章于 2024-08-14 00:10:28 发布

阅读量4.8k

点赞数 3

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vs412237401/article/details/50728383

版权

本文介绍了无监督学习中的聚类算法，包括k-means、k-means++和FCM。k-means通过迭代找到数据的最佳划分，k-means++在初始中心点选择上做了改进，降低了陷入局部最优的风险。而FCM则是一种软聚类方法，允许数据点同时属于多个类别。这些算法在文档分类、用户行为分析等领域有广泛应用。

摘要由CSDN通过智能技术生成

聚类主要是一种无监督学习，用来发现未标注数据的隐藏结构，主要是用来给数据分组，聚类算法一般有硬聚类（k-means，k-means++）和软聚类FCM（fuzzy c-means）。聚类目前广泛应用于文档，音乐，电影的分组，以及基于用户的行为对用户分组等。聚类一般有如下分类，基于层级（hierarchical）的聚类，基于密度（density-based）的聚类还有基于原型（prototype-based）的聚类。

k-means实现思路：
1. 随机从数据集中选择k个中心点
2. 对于数据集中的每一条数据，比较与k个中心点的距离，然后把当前数据分配给最近的中心点
3. 重新计算数据集中k个中心点
4. 重复第二步和第三步，只到中心点的位置变化不变或者变化在指定的范围内或者迭代次数满足设定的目标。
比较与中心点的距离一般采用的是欧式距离，k-means可能会选择到最差的结果，需要多跑几次，而且每次跑的结果

最低0.47元/天解锁文章

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。