高维多数据聚类（sklearn.cluster.affinityPropagation）和降维（manifold.LocallyLinearEmbedding）

最新推荐文章于 2023-06-23 22:33:52 发布

Marina-ju

最新推荐文章于 2023-06-23 22:33:52 发布

阅读量3.1k

点赞数 1

分类专栏： sklearn

原文链接：https://blog.csdn.net/The_Time_Runner/article/details/89853974

版权

sklearn 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

一、聚类
cluster.affinityPropagation

适合高维、多数据快速聚类
不需要指定最终聚类族的个数
对数据的初始值不敏感
对初始相似度矩阵数据的对称性没有要求
和k-centers聚类方法相比，其结果的平方差误差较小

原理：在开始时，将所有节点都看成是聚类中心，通过在样本对之间发消息知道收敛来创建聚类。然后使用少量实例样本作为聚类中心来描述数据集，聚类中心时数据集种最能代表一类数据的样本。

表征变量：适合度responsibility r(i,k)，归属度availability a(i,k),样本i选择样本k作为它的典型代表（exemplar）的累计证据

二、降维
manifold.LocallyLinearEmbedding
返回高维数据的地位投影，保持各个节点之间的相对位置不变。可以看成是一系列通过全局比较一找到最佳非线性嵌入的局部主成分分析，

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
高维多数据聚类（sklearn.cluster.affinityPropagation）和降维（manifold.LocallyLinearEmbedding）

一、聚类cluster.affinityPropagation适合高维、多数据快速聚类不需要指定最终聚类族的个数对数据的初始值不敏感对初始相似度矩阵数据的对称性没有要求和k-centers聚类方法相比，其结果的平方差误差较小原理：在开始时，将所有节点都看成是聚类中心，通过在样本对之间发消息知道收敛来创建聚类。然后使用少量实例样本作为聚类中心来描述数据集，聚类中心时数据集种最能代...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。