机器学习(十一)聚类算法(Kmeans与DBSCAN与分层聚类)

无监督学习中的聚类算法包括KMeans、DBSCAN和分层聚类。KMeans基于样本点与簇中心的距离进行划分,容易受初始点选择影响。DBSCAN是基于密度的聚类方法,能处理任意形状的簇,主要参数为eps和min_samples。分层聚类则产生层次结构的聚类树,包括自下而上合并和自上而下分裂两种方法,常用的距离计算方法有Single Linkage、Complete Linkage和Average Linkage。
摘要由CSDN通过智能技术生成

机器学习(十一)

聚类算法(Kmeans、DBSCAN、分层聚类)

概述:

对于"监督学习"(supervised learning),其训练样本是带有标记信息的,并且监督学习的目的是:对带有标记的数据集进行模型学习,从而便于对新的样本进行分类。而在“无监督学习”(unsupervised learning)中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。对于无监督学习,应用最广的便是"聚类"(clustering)。

“聚类算法”试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个“簇”(cluster),通过这样的划分,每个簇可能对应于一些潜在的概念或类别。

我们可以通过下面这个图来理解:
在这里插入图片描述
上图是未做标记的样本集,通过他们的分布,我们很容易对上图中的样本做出以下几种划分。
当需要将其划分为两个簇时,即 𝑘=2 时:
在这里插入图片描述当需要将其划分为四个簇时,即 𝑘=4 时:

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值