数据挖掘,DBSCAN算法的介绍

DBSCAN是一种基于密度的聚类算法,能发现任意形状的聚类并对抗噪声。算法无需预设聚类数量,通过查找密度可达的对象形成簇。在实例中,DBSCAN将数据分为两个簇:{1,3,4,5,9,10,12}和{2,6,7,8,11},适用于图像分割等场景。" 125513005,11228512,二维+一维模拟:揭示大面积有机太阳能电池的损失机制,"['太阳能技术', '模拟工具', '电能转换', '材料科学']
摘要由CSDN通过智能技术生成

DBSCAN算法

  • 密度聚类方法的指导思想是,只要一个区域中的点的密度大于某个阈值就把它加到与之相近的聚类中去.
  • 密度聚类方法的优点:可以克服基于距离的算法只能发现“类圆形”聚类的缺点,可以发现任意形状的聚类,它还对噪声数据不敏感。与传统的k-means相比,DBSCAN算法不需要输入划分的聚类个数;聚类簇的形状没有偏差;可以在需要时,输入过滤噪声的参数.还可以处理任意形状和大小的簇.
  • 密度聚类方法的缺点:计算密度单元的计算复杂度大,需要建立空间索引来降低计算量,对数据维数的伸缩性比较差.
  • 密度聚类的代表算法有DBSCAN算法,OPTICS算法,DENCLUE算法.
  • 今天我们先介绍DBSCAN算法.
  • -

DBSCAN算法设计思想:从数据中抽取一个未处理过的点,然后如果抽取的点是核心点,那么找出所有从该点密度可达的对象,形成一个簇;如果抽取的点是边缘点,那么跳出本次循环,寻找下一个对象.终止的条件,就是所有的点都被处理过.

下面,我举个例子来讲解DBSCAN算法

             样本事物数据库

<
序号 属性1 属性2
1 1 0
2 4 0
3 0 1
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值