聚类算法、无监督学习、K均值算法及其优化函数

最新推荐文章于 2024-09-06 19:15:00 发布

明夜不点灯

最新推荐文章于 2024-09-06 19:15:00 发布

阅读量504

点赞数 1

分类专栏：机器学习文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/woahxy/article/details/125703594

版权

机器学习专栏收录该内容

28 篇文章 2 订阅

订阅专栏

聚类算法

无监督学习：将无标签样本分为不同的两类或者多类，称为聚类算法

K均值算法

K均值算法是一个迭代算法，共两个步骤

1.簇分配：遍历图中每个样本，根据每个样本点离那个聚类中心近，从而将该样本点分配给该聚类中心，一开始的聚类中心是随机生成的（也是最小化代价函数的过程）

2.移动聚类中心：算出两簇点各自的均值位置，然后将聚类中心移动到各自的均值位置处。（也是选择u值最小化代价函数J）

3.再次重复以上的两个步骤再次寻找新的聚类中心位置

C(i)代表当前的簇的序号，uk代表第k个聚类中心的位置

K均值的优化目标函数

作用：

1.对学习算法进行调试，确保K均值算法运行正确

2.帮助K均值算法找到更好的簇，以避免局部最优解

k均值算法的优化目标（k均值算法最小化的代价函数）

C（i）和ui是随时变化的

初始化聚类中心

步骤：

1.确定聚类中心的数量k，这k个聚类中心的数量要小于样本数量m

2.随机挑选 k个训练样本，让这k个样本成为聚类中心

如果初始化聚类中心最终会取得局部最优，应该多次进行初始化

多次进行初始化聚类中心和运行K均值算法并且在畸变函数J（代价函数J）中选取最小的c和u作为目标，这种方法在k较小时效果较明显，当k值较大时优化效果不明显

如何选取聚类数量和参数K的值

1.肘部法则

选取不同的聚类数量，观察代价函数J大小的变化情况（一般会随着数量的增加而下降），选取下降快速和慢速的分界点，但是有时候不实用

2.根据实际情况选取聚类数量

明夜不点灯

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
聚类算法、无监督学习、K均值算法及其优化函数

聚类算法无监督学习：将无标签样本分为不同的两类或者多类，称为聚类算法K均值算法K均值算法是一个迭代算法，共两个步骤1.簇分配：遍历图中每个样本，根据每个样本点离那个聚类中心近，从而将该样本点分配给该聚类中心，一开始的聚类中心是随机生成的（也是最小化代价函数的过程）2.移动聚类中心：算出两簇点各自的均值位置，然后将聚类中心移动到各自的均值位置处。（也是选择u值最小化代价函数J）3.再次重复以上的两个步骤再次寻找新的聚类中心位置 C(i)代表当前的簇的序号，uk代表第k个聚类中心的位置 K均值的优化目标
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。