密度聚类DBSCAN

DBSCAN是一种基于密度的聚类算法,能够发现任意形状的聚类并有效处理噪声。它通过‘e-邻域’、‘核心对象’等概念来确定样本间的密度关系。算法只需遍历数据一次,利用‘密度可达’和‘密度相连’关系来构建簇。非核心对象被视为噪声。DBSCAN簇是由密度可达和密度相连关系形成的最大样本集合。
摘要由CSDN通过智能技术生成

密度聚类

基于密度的聚类,假设聚类结构能够通过样本分布的紧密程度确定。通常情况下,密度聚类算法从样本密度的角度来考察样本之间的可连接性。

基于密度聚类的特性

  • 发现任意形状的聚类
  • 处理噪声
  • 一遍扫描(只检查局部区域来判断密度)
  • 需要密度参数作为终止条件

一些研究

  • DBSCAN (KDD’96)
  • OPTICS (sigmod’99)
  • DENCLUE (kdd’98)
  • CLIQUE (SIGMOD’98)也是基于网格的

DBSCAN

全称Density-Based Spatial Clustering Appliacations with Noise
DBSCAN,它基于一组”领域”参数 (ϵ,MinPts) 来刻画样本分布的紧密程度。

几个重要概念

  • e-邻域
    xjD ,其 ϵ -邻域包含样本集D种与 xj 的距离不大于 ϵ 的样本,即 Nϵ(xj)=
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值