K-means聚类

狗狗人

已于 2023-03-16 14:22:54 修改

阅读量64

点赞数 1

分类专栏：遗产文章标签：聚类 kmeans 算法

于 2023-02-17 14:27:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dogman_/article/details/122281728

版权

遗产专栏收录该内容

27 篇文章 1 订阅

订阅专栏

前言

首先需要先介绍一下无监督学习，所谓无监督学习，就是训练样本中的标记信息是未知的，目标是通过对无标记训练样本的学习来揭示数据的内在性质以及规律。通俗得说，就是根据数据的一些内在性质，找出其内在的规律。而这一类算法，应用最为广泛的就是“聚类”。

聚类算法可以对数据进行数据归约，即在尽可能保证数据完整的前提下，减少数据的量级，以便后续处理。也可以对聚类数据结果直接应用或分析。

而Kmeans 算法可以说是聚类算法里面较为基础的一种算法。

K-means

这里先以二维数据进行

对于平面中的一堆数据，想要将数据分为若干团簇，便使用了该算法

其思想与em算法类似，都是先假定，再通过迭代获得最终的数值解

详细步骤

若想要分类的类数为n

1，先在样本空间中随机定n个点，视为各自簇的中心点
2，对于每一个数据，求得其到这n个点的距离（曼哈顿，欧式），取距离最短的点作为其分类
3，将所有数据分类后，重新计算这n个簇的中心点，作为新的n个中心点
4，复2，重复足够次数，直到收敛足够小
5，得到最终结果

注意事项

第三步中的新中心点计算：
与回归类似，将所有点与（x，y）的距离之和表达式写出，求极小值

n的选定方法，与KNN类似，也是迭代看趋势
在真实簇数N前后，有较大的斜率变化，我们选取这个值作为聚类的参数

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

狗狗人 CSDN认证博客专家 CSDN认证企业博客

码龄4年

50: 原创

76万+: 周排名

42万+: 总排名

3万+: 访问

: 等级

495: 积分

7: 粉丝

62: 获赞

5: 评论

68: 收藏

私信

关注

热门文章

分类专栏

最新评论

渲染流水线相关知识总结
CSDN-Ada助手: 恭喜你，获得了 2023 博客之星评选的入围资格，请看这个帖子（https://bbs.csdn.net/topics/615211161?utmsource=blogger_star_comment）。请在这里提供反馈： https://blogdev.blog.csdn.net/article/details/129986459?utmsource=blogger_star_comment。
绒毛/短毛渲染
ssssski: ：直到尖尖
Unity模板缓冲
ssssski: 啊啊啊啊啊啊
Unity模板缓冲
ssssski: 哇哇哇哇
unity边缘检测
ssssski: 哇哦哇哦哇哦

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。