基于密度的聚类

k-means算法的缺陷是不能聚类哪些非凸的数据集,k-means聚类的形状一般只能是球状的,不能推广到任意的形状。如果S中任两点的连线内的点都在集合内。就是没有凹进去的部分。这就是凸集的定义。k-means本质上是将样本空间划分成k个Voronoi区域(泰森多边形),决定了划分结果的K个簇一定是凸集。基于密度的聚类方法,可以聚类任意的形状。为什么基于密度的聚类方法,可以聚类任意的形状呢?因为基于密度的聚类是点与点的连接,所以可以聚类任意形状的数据集。
半径eps和密度阈值,每个数据点有一个半径为eps的邻域;如果这个邻域内包含的点超过了密度阈值,那么记这个点为
核心对象。如果某个点的邻域内的点数小于密度阈值,且该点在某个核心点的邻域内,则称这个点为边界点。其他的点
称为噪声点。核心点邻域内的所有点都是该核心点的直接密度直达。而且密度直达的传递性可以推到出密度可达。
如果某两个点都可以由一个点密度可达,那么这“某两个点”密度相连。将密度相连的点连接在一起,就形成了聚类簇。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值