【聚类3】密度聚类+层次聚类

1. 密度聚类

1.1 概念

- "别名":
		基于密度的聚类

- "英文":
		Density-based clustering

- "思想":
		此类算法假设聚类结构能够通过样本分布的紧密程度确定

- "解释思想":
		就是说,密度聚类算法从样本的密度角度来考察样本之间的可连续性(样
	本之间可连续性代表簇的纯度越纯),并基于可连续样本不断拓展聚类簇,以
	获得最终的聚类结果。

- "欧式距离":
		在本节中,默认距离为欧式距离。

1.2 DBSCAN算法

  • dbscan思想
DBSCAN是一种著名的密度聚类算法,它基于一组"邻域(neighborhood)参数",来刻画样本分布的紧密程度。
  • 重要概念
已知 D={ x 1 , x 2 , . . . , x m x_1,x_2,...,x_m x1,x2,...,xm} 性质
ε \varepsilon ε-邻域 包含样本集D中与 x j x_j xj的距离不大于 ε \varepsilon ε的样本,即 N ε ( x j ) = { x i ∈ D ∣ d i s t ( x i , x j ) ≤ ε } N_{\varepsilon}(x_j)=\{x_i\in D|dist(x_i,x_j)\leq\varepsilon\} Nε(xj)={ xiDdist(xi,xj)ε}
核心对象(core object) x j x_j xj ε \varepsilon ε-邻域至少包含MinPts个样本,则 x j x_j xj是一个核心对象。即 ∣ N ε ( x j ) ∣ ≥ M i n P t s |N_{\varepsilon}(x_j)|\geq MinPts Nε(xj)MinPts
密度直达(directly density-reachable) x j x_j xj位于 x i x_i xi ε \varepsilon ε-邻域,且 x i x_i xi是核心对象,则称 x j x_j xj x i x_i xi密度直达 不满足对称性
密度可达(density-reachable) x i x_i xi x j x_j xj,若存在样本序列 p 1 , p 2 , . . . , p n , 其 中 p 1 = x i , p n = x j 且 p i + 1 由 p i 密 度 直 达 p_1,p_2,...,p_n,其中p_1=x_i,p_n=x_j且p_{i+1}由p_i密度直达 p1,p2,...,pn,p1=xi,pn=xj
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

姜满月

鼓励,鼓励,更加努力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值