Clustering聚类

前言:
本文主要翻译sklearn文档Clustering的内容,并进行相关算法的解析和代码实现。本文由callback发布于http://blog.csdn.net/u010248552/article/details/78476981, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请留言站内。谢谢合作!

概括

本文由来是看见了sklearn的clustering的聚类数据图,如下,对于聚类方法能很好的一眼看出来你需要哪个算法去实现不同场景和不同需求的数据聚类任务。有了这张图,你可以很快的知道你要选什么算法,但是每个算法有它算法的本身特性,这也要求我们在调节算法时知道它的算法过程,各种阈值的合适取值。
clustering
下面的表也是对应不同算法的一些细节对比,最关键的就是scale规模,usecase使用场景,和基本的几何原理。
comparision
非几何聚类时有用的集群有一个特定的形状,即非流形,欧几里得距离不是正确的度量的标准。这种情况出现在上图的两大行。

算法细节

  1. k-means
  2. DBSCAN
  3. [GaussianMixture]

相关资料

[1]https://www.zhihu.com/question/34554321

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值