基于sklearn的聚类方法简介

最新推荐文章于 2024-07-27 06:30:00 发布

NP_hard

最新推荐文章于 2024-07-27 06:30:00 发布

阅读量643

点赞数 3

分类专栏： Machine learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/NP_hard/article/details/116791689

版权

博客介绍了基于sklearn的聚类方法，重点讲解了Affinity Propagation算法的原理和投票过程。该算法将数据点视为投票者，通过相互投票选出聚类中心（leader），并涉及相似度矩阵、参考度和适合度等概念。通过不断迭代更新，最终确定聚类结果。

摘要由CSDN通过智能技术生成

文章目录

相似度/距离计算方法总结

一个大佬写的链接

在这里插入图片描述

聚类的基本思想和方法

基本思想
对于给定的类别数目k，首先给出初始化分，通过迭代改变样本核簇的隶属关系，使得每一次改进之后的划分方案都较前一次好
方法在这里插入图片描述
本文大概会讲到的聚类

Affinity Propagation

原理

假设我们有N个数据，那么AP聚类就是把这N个数据看成N个人，然后这N个人之间进行投票，选择出几个leader
名词介绍
Exemplar：指聚类中心，在AP聚类里，聚类中心是明确的点（leader）
Similarity：s(i,j)，指点j作为点i的聚类中心的相似度
Preference：s(i,i) 或 p(i)，指点i作为聚类中心的参考度，一般取s的Similarity的中值
Responsibility：r(i,k)，描述k适合作为i的聚类中心的程度
Availability：a(i,k)，描述i选择k作为聚类中心的适合程度
Damping factor：阻尼系数，为了避免振荡

阻尼系数
$r (i, k) = λ * r (i, k) o l d + (1 -$

最低0.47元/天解锁文章

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。