KMean算法精讲

最新推荐文章于 2024-05-18 12:25:51 发布

菜鸟炼丹师

最新推荐文章于 2024-05-18 12:25:51 发布

阅读量5k

点赞数 7

分类专栏：机器学习文章标签：算法聚类机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chenjunheaixuexi/article/details/125249551

版权

本文目录

KMeas算法是一种聚类算法，同时也是一种无监督的算法，即在训练模型时并不需要标签，其主要目的是通过循环迭代，将样本数据分成 $K$ 类。

基本训练步骤

Step1：初始化 $K$ 个聚类中心（不必是真是的样本）
Step2：分别计算所有样本点到这 $K$ 个聚类中心的距离，并把样本点划分至距离最近的group
Step3：针对于每个group，计算其组内的平均点作为新的聚类中心（例如用户有年龄、性别两个特征，针对于年龄特征直接求平均值即可，对于性别特征使用onehot编码，每个纬度都求其平均值即可）
Step4：重复步骤2和3直到满足终止条件

其基本过程如下图所示：
在这里插入图片描述

关于KMeans的几个问题

KMeans算法的目标函数是什么？

已知观测集 $x_1,x_2,...,x_n)$ ，其中每个观测都是一个d维实向量，k平均聚类要把这

最低0.47元/天解锁文章

菜鸟炼丹师

关注

7
点赞
踩
21

收藏

觉得还不错? 一键收藏
打赏
0
评论
KMean算法精讲

KMeas算法是一种聚类算法，同时也是一种无监督的算法，即在训练模型时并不需要标签，其主要目的是通过循环迭代，将样本数据分成K类。
复制链接

扫一扫

专栏目录

菜鸟炼丹师 CSDN认证博客专家 CSDN认证企业博客

码龄3年

41: 原创

6万+: 周排名

128万+: 总排名

4万+: 访问

: 等级

583: 积分

685: 粉丝

116: 获赞

31: 评论

271: 收藏

私信

关注

热门文章

分类专栏

最新评论

【文本预处理】
Fire. man: 求问jupyter 里面显示在data文件夹权限不够不可以下载，如何解决博主
ALS算法理解
weixin_44452700: 显式反馈求U, 最后一步是咋倒腾出来的, 没看懂
ALS算法理解
跳动的西格玛: 你好，谢谢你的回复！我指的是评分矩阵中的评分，如果实际情形中没有评分只有一些如观看、点击的隐式反馈，如何得到的评分r？
ALS算法理解
菜鸟炼丹师: 你是指的代价函数中的r_ij吗
ALS算法理解
跳动的西格玛: 隐式反馈怎么来的r呢？不太明白，望作者解答一下，谢谢

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

菜鸟炼丹师 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。