【聚类3】密度聚类+层次聚类

最新推荐文章于 2024-01-29 23:53:50 发布

姜满月

最新推荐文章于 2024-01-29 23:53:50 发布

阅读量674

点赞数 1

分类专栏： trush 文章标签：聚类机器学习算法

本文链接：https://blog.csdn.net/qq_51184516/article/details/124514536

版权

文章目录

1. 密度聚类
2. 层次聚类

1. 密度聚类

1.1 概念

- "别名"：
		基于密度的聚类

- "英文"：
		Density-based clustering

- "思想":
		此类算法假设聚类结构能够通过样本分布的紧密程度确定

- "解释思想":
		就是说，密度聚类算法从样本的密度角度来考察样本之间的可连续性（样
	本之间可连续性代表簇的纯度越纯），并基于可连续样本不断拓展聚类簇，以
	获得最终的聚类结果。

- "欧式距离"：
		在本节中，默认距离为欧式距离。

1.2 DBSCAN算法

dbscan思想

DBSCAN是一种著名的密度聚类算法，它基于一组"邻域（neighborhood）参数"，来刻画样本分布的紧密程度。

重要概念

已知	D={ $x_1,x_2,...,x_m$ }	性质
$\varepsilon$ -邻域	包含样本集D中与 $x_j$ 的距离不大于 $\varepsilon$ 的样本，即 $N_{\varepsilon}(x_j)=\{x_i\in D\|dist(x_i,x_j)\leq\varepsilon\}$
核心对象（core object）	若 $x_j$ 的 $\varepsilon$ -邻域至少包含MinPts个样本，则 $x_j$ 是一个核心对象。即 $\|N_{\varepsilon}(x_j)\|\geq MinPts$
密度直达（directly density-reachable）	若 $x_j$ 位于 $x_i$ 的 $\varepsilon$ -邻域，且 $x_i$ 是核心对象，则称 $x_j$ 由 $x_i$ 密度直达	不满足对称性
密度可达（density-reachable）	对 $x_i$ 与 $x_j$ ,若存在样本序列 $p_1,p_2,...,p_n,其中p_1=x_i,p_n=x_j且p_{i+1}由p_i密度直达$

最低0.47元/天解锁文章

姜满月

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
【聚类3】密度聚类+层次聚类

文章目录1. 密度聚类1.2 DBSCAN算法1. 密度聚类1.1 概念- "别名"：基于密度的聚类- "英文"： Density-based clustering- "思想": 此类算法假设聚类结构能够通过样本分布的紧密程度确定- "解释思想": 就是说，密度聚类算法从样本的密度角度来考察样本之间的可连续性（样本之间可连续性代表簇的纯度越纯），并基于可连续样本不断拓展聚类簇，以获得最终的聚类结果。- "欧式距离"：在本节中，默认距离为欧式距离。
复制链接

扫一扫