机器学习读书笔记之8 - 聚类

最新推荐文章于 2020-10-13 15:53:19 发布

linolzhang

最新推荐文章于 2020-10-13 15:53:19 发布

阅读量503

点赞数 2

分类专栏：机器学习 | 计算机视觉文章标签：机器学习读书笔记聚类 Cluster K-means

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linolzhang/article/details/54411827

版权

机器学习 | 计算机视觉专栏收录该内容

37 篇文章 10 订阅

订阅专栏

聚类（Cluster） 是无监督学习的一种，与分类相区别的地方在于：

1. 分类的目的在于将数据进行明确的归属划分，聚类的目的只是使同一类对象的相似度尽可能大；

2. 聚类作为非监督学习，不需要训练和学习过程；

目前聚类的方法很多，根据基本思想的不同，大致可以将聚类算法分为五大类：层次聚类算法、分割聚类算法、基于约束的聚类算法、机器学习中的聚类算法和用于高维度的聚类算法。

K-Means算法

K-Means可以说是聚类算法中最简单、也是应用最多的方法，关键点有两个：

1）中心用各类别中所有数据的均值表示；

2）通过迭代算法进行数据更新；

K-Means算法 结果好坏依赖于对初始聚类中心的选择、容易陷入局部最优解、对K值的选择没有准则可依循、对异常数据较为敏感。

基于此，在K-Means的基础上诞生了许多变体算法，比如Bradley和Fayyad等，主要改进点在于降低对中心的依赖，调整迭代过程中重新计算中心方法等。

层次聚类

层次聚类的基本步骤：

1、初始化过程，将每个样本作为一类；

计算类间距离D，即样本与样本之间的相似度

给定阈值T，当相似度小于T时，可以合并

2、寻找各个类之间最近的两个类，如果距离小于T，执行合并；

3、计算新合并的这个类与原有类之间的相似度；

4、重复2和3直到没有可以合并的类，结束。

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习读书笔记之8 - 聚类

聚类（Cluster）是无监督学习的一种，与分类相区别的地方在于：1. 分类的目的在于将数据进行明确的归属划分，聚类的目的只是使同一类对象的相似度尽可能大；2. 聚类作为非监督学习，不需要训练和学习过程；目前聚类的方法很多，根据基本思想的不同，大致可以将聚类算法分为五大类：层次聚类算法、分割聚类算法、基于约束的聚类算法、机器学习中的聚类算法和用于高维度的聚类
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。