DBSCAN

DBSCAN

DBSCAN是一种密度聚类算法,它基于一组参数( ϵ \epsilon ϵ,MinPts)来刻画样本分布的紧密程度。

1、算法原理

如上图所示,DBSCAN的有两个非常重要的参数 ϵ \epsilon ϵ和MinPts;图中
“归同类"的意思是"如果该范围内有样本已经归类,则这些样本都属于该类;否则就创建一个新类别,这些样本都属于这个新类别”。
ϵ \epsilon ϵ:指的是范围半径;
M i n P t s MinPts MinPts:指的是聚为一类的最小样本数;

2、sklearn中的DBSCAN

from sklearn import cluster
dbscan = cluster.DBSCAN(eps=1.2, min_samples=10)
clustering_labels = dbscan.fit(train_data)

3、DBSCAN的优缺点

在这里插入图片描述
如图一、四,DBSCAN对离散型数据的聚类效果并不好;图五效果不好的原因是参数 ϵ \epsilon ϵ的值太大了,只要 ϵ \epsilon ϵ的值设置好了,图五也能很好地聚类;DBSCAN能识别噪音,可以很好地不受噪音的影响。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值