机器学习之聚类

本文介绍了机器学习中的聚类方法,包括划分方法如K-means,层次方法如DIANA,基于密度的方法如DBSCAN,模糊聚类如EM算法,以及基于模型的方法。此外,还探讨了聚类效果的评价指标,如轮廓系数、Rand Index和between_ss / total_ss,这些指标用于衡量聚类的质量。
摘要由CSDN通过智能技术生成

机器学习之聚类

聚类

1、聚类方法有哪些(常用)
划分方法:

描述:分裂法构造K个分组。

​ K-means算法

层次方法:

描述:对给定的数据集进行层次似的分解,直到某种条件满足为止。

​ DIANA、BIRCH、Chameleon

基于密度的方法:

描述:基于密度的方法与其它方法的一个根本区别是:它不是基于各种各样的距离的,而是基于密度的。只要一个区域中的点的密度大过某个阈值,就把它加到与之相近的聚类中去。

​ DBSCAN算法、OPTICS算法

模糊聚类:

​ EM算法

基于模型的方法:

描述:基于模型的方法给每一个聚类假定一个模型,然后去寻找能够很好的满足这个模型的数据集。

2、聚类方法的评价指标
Silhouette Coefficient(轮廓系数)
  • 对象与其自身簇(内聚力)相比与其他簇(分离)相似程度的度量。
  • 值从-1到+1,其中高值表示对象与其自己的簇很好地匹配并且与相邻
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值