DBSCAN

这是一种密度聚类算法。这种算法在检测,以及找异常点方面很方便。

首先这种算法在理解原理之前,需要理解几个名词概念。核心对象:如果在样本x的领域内有M个样本。密度直达:若xj位于xi的ε-邻域中,且xi是核心对象,则称xj由xi密度直达。密度可达:对于xi与xj若存在样本序列p1,p2,...,pn,其中 p1=xi,pn=xj,且pi+1由pi密度直达,则称xj由xi密度可达。密度相连:对xi与xj,若存在xk使得xi与xj均由xk密度可达,则称 xi与xj密度相连。

算法实现过程:通俗一点说就是以每个核心对象为中心,像海绵吸水一样往外不断扩充,形成簇。首先,扫描整个数据集,随机找一个核心对象,寻找以该核心点出发的所有密度相连的数据点,作为其扩充点,直到找不到密度相连点为止。不断重复以上过程,直到数据集没有核心对象为止,此时,没有出现在任何簇的点就是异常点了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值