机器学习笔记6——无监督学习（聚类算法）

最新推荐文章于 2024-03-20 19:35:28 发布

VIP文章余生最年轻

最新推荐文章于 2024-03-20 19:35:28 发布

阅读量3.8w

点赞数 11

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40597317/article/details/80949123

版权

关键字：K-means算法，聚类中心，畸变函数

一、定义

与有监督学习相比，无监督学习的样本没有任何标记。无监督学习的算法需要自动找到这些没有标记的数据里面的数据结构和特征。这里介绍一下聚类算法和降维。

二、聚类算法

2.1 定义

把数据集分成一个个的簇cluster（也可以理解为一组一组的形式）

2.2 K-means算法（K均值算法）

（1）首先随机生成几个点，叫聚类中心（Cluster Centroids）。Cluster Centroids的个数一般与想把数据分成几类的类数相同。如下图，想分成两类，首先随机生成两个点。

（2）这是一个迭代算法，一次迭代包含两个步骤。第一个是簇分配，第二个是移动聚类中心。

簇分配：遍历数据集里面的每个数据，也就是图例的绿色的点。然后根据每个数据是距离红色的聚类中心近还是蓝色的聚类中心近，来判断将数据分配给其中一个聚类中心。迭代终止条件：聚类中心不再变化，每个数据分配到的聚类不变。

图例判断结束之后是这样的：

移动聚类中心：算出每一个聚类的均值，将聚类中心移动到该点处。图例就分别算出蓝色聚类和红色聚类的均值，然后移动聚类中心。

（3）伪代码表示

最低0.47元/天解锁文章

余生最年轻

关注

11
点赞
踩
96

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记6——无监督学习（聚类算法）

关键字：K-means算法，聚类中心，畸变函数一、定义与有监督学习相比，无监督学习的样本没有任何标记。无监督学习的算法需要自动找到这些没有标记的数据里面的数据结构和特征。这里介绍一下聚类算法。二、聚类算法2.1 定义把数据集分成一个个的簇cluster（也可以理解为一组一组的形式）2.2 K-means算法（K均值算法）（1）首先随机生成几个点，叫聚类中心（Cluster Centroids）。C...
复制链接

扫一扫

专栏目录

余生最年轻 CSDN认证博客专家 CSDN认证企业博客

码龄7年

24: 原创

18万+: 周排名

74万+: 总排名

66万+: 访问

: 等级

2628: 积分

227: 粉丝

364: 获赞

77: 评论

1925: 收藏

私信

关注

热门文章

分类专栏

最新评论

python.sklearn.gaussian_process高斯过程回归的调用
m0_62331217: 画出来的图没有博主那么完美需要怎么优化啊如果使用经纬度作为二维变量输入影响房价的话应该使用什么核函数好一点
B样条曲线（B-spline Curves）
卡琦110: 全文中阶和次应该都搞混了
B样条曲线（B-spline Curves）
卡琦110: 在一般表达中，应该表示为K阶（K-1次）
高斯过程回归GPR
哇哦是这样啊: 谢谢分享
python.sklearn.gaussian_process高斯过程回归的调用
sunchenhao_hh: 您好，想请教一下如果训练集是有好几个特征的，有的特征是10的-1量级的，有的是10的-3量级的，这种情况如果使用了RBF作为核函数，是不是length scale就要给定各向异性的了呢，给的值就是每个特征的数量级或者平均值？还是说随便给一个它自己会优化呀

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。