机器学习之聚类算法

最新推荐文章于 2024-08-09 23:32:16 发布

西海岸看日出

最新推荐文章于 2024-08-09 23:32:16 发布

阅读量938

点赞数 3

分类专栏：机器学习原理解析文章标签：机器学习聚类 K-Means 层次聚类划分聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38236355/article/details/89320412

版权

本文介绍了聚类算法的基本概念，包括层次聚类（自底向上与自顶向下）和划分聚类（如K-Means、K-Means++、Mini Batch K-Means），并详细阐述了算法思想、距离计算方法以及K-Means的优缺点。

摘要由CSDN通过智能技术生成

聚类是一种非监督式学习算法，它不要求源数据集有标签，一般应用于做数据探索性分析，聚类算法的结果是将不同的数据集按照各自的典型特征分成不同类别，不同人对聚类的结果解读可能不同。
总体上来说，聚类算法分为层次聚类(Hierachical Methods)和划分聚类(Partitioning Methods)。

一、层次聚类

层次聚类不需要指定类数，按策略不同可分为自底向上的聚类方法(agglomerative hierarchical clustering),比如AGNES和自上向下的聚类方法(divisive hierarchical clustering)，比如DIANA。

1、自底向上的聚类方法
算法思想：
将每个点都看成一个簇；
将两个最近的簇合并为一个簇；
不断重复上述过程，直到达到预期簇或簇之间的距离满足要求为止。

2、自上向下的聚类方法
算法思想：
将样本的每个点都看成一个簇；
然后找出簇中距离最远的两个簇进行分裂；
不断重复到预期簇或者满足终止条件为止。

如何判断两个簇之间的距离
有三种不同的计算形式：
①、单链接聚类：
一个簇的所有成员到另一个簇的所有成员之间的最短两点之间的距离。
②、全连接聚类：
两个簇中最远的两个点之间的距离。
③、平均连接聚类：
两个簇中的点两两距离求平均值。

最低0.47元/天解锁文章

西海岸看日出

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。