机器学习（十一）聚类算法（Kmeans与DBSCAN与分层聚类）

最新推荐文章于 2024-05-25 09:03:31 发布

一人白

最新推荐文章于 2024-05-25 09:03:31 发布

阅读量2.2k

点赞数 2

文章标签： python sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43576343/article/details/103465339

版权

无监督学习中的聚类算法包括KMeans、DBSCAN和分层聚类。KMeans基于样本点与簇中心的距离进行划分，容易受初始点选择影响。DBSCAN是基于密度的聚类方法，能处理任意形状的簇，主要参数为eps和min_samples。分层聚类则产生层次结构的聚类树，包括自下而上合并和自上而下分裂两种方法，常用的距离计算方法有Single Linkage、Complete Linkage和Average Linkage。

摘要由CSDN通过智能技术生成

机器学习（十一）

聚类算法（Kmeans、DBSCAN、分层聚类）

概述：

对于"监督学习"(supervised learning)，其训练样本是带有标记信息的，并且监督学习的目的是：对带有标记的数据集进行模型学习，从而便于对新的样本进行分类。而在“无监督学习”(unsupervised learning)中，训练样本的标记信息是未知的，目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律，为进一步的数据分析提供基础。对于无监督学习，应用最广的便是"聚类"(clustering)。

“聚类算法”试图将数据集中的样本划分为若干个通常是不相交的子集，每个子集称为一个“簇”(cluster)，通过这样的划分，每个簇可能对应于一些潜在的概念或类别。

我们可以通过下面这个图来理解：
在这里插入图片描述
上图是未做标记的样本集，通过他们的分布，我们很容易对上图中的样本做出以下几种划分。
当需要将其划分为两个簇时，即 𝑘=2 时：
当需要将其划分为四个簇时，即 𝑘=4 时：

最低0.47元/天解锁文章

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
机器学习（十一）聚类算法（Kmeans与DBSCAN与分层聚类）

机器学习（十一）聚类算法（Kmeans、DBSCAN、分层聚类）概述：对于"监督学习"(supervised learning)，其训练样本是带有标记信息的，并且监督学习的目的是：对带有标记的数据集进行模型学习，从而便于对新的样本进行分类。而在“无监督学习”(unsupervised learning)中，训练样本的标记信息是未知的，目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。