无监督学习 | 层次聚类之凝聚聚类原理及Sklearn实现

最新推荐文章于 2024-07-19 19:18:47 发布

X1AO___X1A

最新推荐文章于 2024-07-19 19:18:47 发布

阅读量6k

点赞数 4

分类专栏：无监督学习 # 聚类算法文章标签：机器学习无监督学习层次聚类凝聚聚类 sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45488228/article/details/102493562

版权

文章目录

1. 层次聚类
2. Sklearn 实现
- 2.1 层次图可视化
参考文献

相关文章：

机器学习 | 目录

机器学习 | 聚类评估指标

机器学习 | 距离计算

无监督学习 | KMeans 与 KMeans++ 原理

无监督学习 | DBSCAN 原理及Sklearn实现

无监督学习 | GMM 高斯混合聚类原理及Sklearn实现

1. 层次聚类

层次聚类（hierarchical clustering）试图在不同层次对数据集进行划分，从而形成树形的聚类结构。数据集的划分可采用“自底向上”的聚合策略，也可采用“自顶向下”的分拆策略。^[1]

因此其优点是可以层次化聚类，将聚类结构视觉化；而缺点是计算量大，我们将在后面提到这一点。

1.1 凝聚聚类

凝聚聚类（Agglomerative Clustering）是一种采用自底向上聚类策略的层次聚类算法。它先将数据集中的每个样本看作一个初始聚类簇，然后在算法运行的每一步中找出距离最近的两个聚类簇进行合并。该过程不断重复，直到达到预设的聚类簇个数。这里的关键是如何计算聚类簇之间的距离。实际上，每个簇是一个样本集合，因此，只需要采用关于集合的某种距离即可。例如，给定聚类簇 $C_i$ 与 $C_j$ ，可通过下面的式子来计算距离：

$最小距离：d_{\min }\left(C_{i}, C_{j}\right)=\min _{\boldsymbol{x} \in C_{i}, \boldsymbol{z} \in C_{j}} \operatorname{dist}(\boldsymbol{x}, \boldsymbol{z}) \tag{1}$

最低0.47元/天解锁文章

关注

4
点赞
踩
26

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

X1AO___X1A CSDN认证博客专家 CSDN认证企业博客

码龄5年

43: 原创

5万+: 周排名

212万+: 总排名

11万+: 访问

: 等级

1655: 积分

66: 粉丝

140: 获赞

45: 评论

694: 收藏

私信

关注

热门文章

分类专栏

最新评论

PyPDF2 | 利用 Python 实现 PDF 分割
qq_64831425: from PyPDF2 import PdfReader, PdfWriter infile = r"" outfile = r"" pdf_input_left = PdfReader(open(infile, 'rb')) pdf_input_right = PdfReader(open(infile, 'rb')) pdf_output = PdfWriter() page = pdf_input_left.pages[0] width = page.mediabox.width height = page.mediabox.height page_count = len(pdf_input_left.pages) for i in range(page_count): # left page page_left = pdf_input_left.pages[0] page_left.mediabox.lower_left = (0, 0) page_left.mediabox.lower_right = (width/2, 0) page_left.mediabox.upper_left = (0, height) page_left.mediabox.upper_right = (width/2, height) pdf_output.add_page(page_left) # right page page_right = pdf_input_right.pages[0] page_right.mediabox.lower_left = (width/2, 0) page_right.mediabox.lower_right = (width, 0) page_right.mediabox.upper_left = (width/2, height) page_right.mediabox.upper_right = (width, height) pdf_output.add_page(page_right) pdf_output.write(open(outfile, 'wb')) 最新版的
无监督学习 | 层次聚类之凝聚聚类原理及Sklearn实现
SZX0311: 离差平方和公式明白，我看了原文，文中xi是一个得分，但是这里算距离时，ess公式中的xi是什么？
无监督学习 | KMeans之Sklearn实现：电影评分聚类
布娜呐:
SQLite | 数据库设计与 Creat Table 语句
学无止境勤且思: 外键可以嵌套么？比如A表K1作为B表P2的外键，B表P2作为C表T3的外键，报错：“create table failed.unknown column "BU_Data" in foreign key definition”
SQLite | SQLite 与 Pandas 比较篇之一
sleeping_dogs: 性能差距如何，据说sqlite远超pandas

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。