初学ML笔记N0.6——聚类方法

最新推荐文章于 2024-05-15 09:47:32 发布

天涯__

最新推荐文章于 2024-05-15 09:47:32 发布

阅读量1.6k

点赞数

分类专栏： ML入门笔记文章标签：机器学习聚类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wy250229163/article/details/51913339

版权

聚类的定义

聚类就是按数据的相似性，将其划分为多个类别，从而使内别内的相似度大，内别间的相似度小。
它是一种无监督学习方式，即不需要先给定样本进行学习。

相似度的度量方式

聚类的目的就是为了将相似样本的样本分到同一个类别里。那么，首先要考虑的便是如何度量这个相似。下面给出几种常见的度量方式：

闵可夫斯基距离里，当p=2时，便是我们熟知的欧氏距离，可见，它的适用范围属于能在坐标轴里描绘的点的样本集。
关于各种相似性的度量，可参考下面这篇博客的详细解释：

http://www.cnblogs.com/heaad/archive/2011/03/08/1977733.html

K-means算法

算法首先随机地选择K个对象，每个对象初始地代表了一个簇的平均值或中心。对剩余的每个对象根据其与各个簇中心的距离，将其赋给最近的簇。然后重新计算出每个簇的中心，然后继续将每个点赋给最近的簇。这个过程不断重复，直到准则函数收敛。
其中，准则函数常常使用最小平方误差函数MSE，其定义如下：

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
初学ML笔记N0.6——聚类方法

聚类的定义聚类就是按数据的相似性，将其划分为多个类别，从而使内别内的相似度大，内别间的相似度小。它是一种无监督学习方式，即不需要先给定样本进行学习。相似度的度量方式聚类的目的就是为了将相似样本的样本分到同一个类别里。那么，首先要考虑的便是如何度量这个相似。下面给出几种常见的度量方式：闵可夫斯基距离里，当p=2时，便是我们熟知的欧氏距离，可见，它的适用范围属于能在坐标轴里描绘的点的样本集。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。