机器学习——非监督算法（聚类分析）

最新推荐文章于 2024-08-09 23:32:16 发布

赵小刀的小锦囊

最新推荐文章于 2024-08-09 23:32:16 发布

阅读量1.4k

点赞数

分类专栏：机器学习文章标签：聚类算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cygnet477/article/details/105532464

版权

本文介绍了聚类算法的核心思想，包括K-means的工作原理、聚类评估标准——轮廓系数，以及如何使用API进行聚类和评估。通过案例分析展示了聚类效果，并探讨了该算法的优缺点，指出其在实践中直观易用但可能陷入局部最优解的问题。

摘要由CSDN通过智能技术生成

文章目录

1.核心思想
2.聚类算法 API
3.案例分析
4.优缺点分析

1.核心思想

1.聚类算法中有超参数 K，理解为将数据划分为几个类别，一般现实实现时，知道划分类别的个数。例 K=3 时
2.随机在数据当中抽取 3个样本，当做三个类别的中心点(k1,k2,k3）
3.计算其余的点分别到这三个中心店的距离，每一个样本有三个距离(a,b,c)，对每一个样本从（k1,k2,k3）中间选出距离最近的一个点作为自己的标记，形成一个族群；
4.分别计算这三个族群的平均值；把这三个平均值与之前的三个旧中心点进行比较。如果相同，则结束聚类；如果不同，则把这三个平均值点作为新的中心点，重复步骤 3；
聚类评估标准：轮廓系数
$sc_i=\frac{b_i-a_i}{max(b_i,a_i)}$

最低0.47元/天解锁文章

赵小刀的小锦囊

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。