k-means聚类算法

最新推荐文章于 2024-01-13 01:54:14 发布

sophia_xw

最新推荐文章于 2024-01-13 01:54:14 发布

阅读量482

点赞数 1

文章标签：深度学习算法 k-means聚类 MATLAB代码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sophia_xw/article/details/69388478

版权

说到聚类，得跟分类区别开来，分类是按人为给定的标准将样本归到某个类别中去，在机器学习中多是监督学习，也就是训练样本要给标签（正确的类别信息）；而聚类是在某种规则下自动将样本归类，在机器学习中是无监督学习，不需要提前给样本打标签。

k-means聚类算法，就是在某种度量方式下，将样本自动划分到k个类别中去。比如，我想把随机取的100个点划分为3类，就可以用这种方法来做聚类。这里的k是类别的个数，可以人为给定。

首先，k-means中的种子点初始值可以随意给定，后面会在算法中不断修正；

其次，度量方式也可自选，比如对散点分类中的各种距离，或者样本之间的相似系数等等；

最后，算法中更新种子点的方式亦可自定。（http://www.csdn.net/article/2012-07-03/2807073-k-means 文章中给出了三种更新种子点的方式）

算法：

step-1：任意选定k个种子点（每个种子点代表一个类别）；

step-2：计算所有点（k个种子点可以不算）到k个种子点的“距离”；

step-3：对每个点，选择“距离最小”的种子点，将该点归于相应种子点类别；

step-4：按均值规则（或其他更新方法）更新种子点信息；

step-5：循环step-2到step-4知道种子点不再变换或者达到最大迭代次数。

示例：

在[0,1]上随机撒500个点，按欧式距离将就近分为4类，种子点按均值规则更新，代码在（https://github.com/sophia-hxw/MachineLearning ）给出，以下是示例结果：

第一张图

随机撒的500个点及用不同颜色标注的任意选定的4个种子点

第二张图

将500个点按距离远近依次归到4个类别中的结果

第三张图

更新一次种子点并重新将500个点按距离归到4类的结果

第四张图

对这500个点和4个初始种子点的最终聚类算法结果图

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
k-means聚类算法

说到聚类，得跟分类区别开来，分类是按人为给定的标准将样本归到某个类别中去，在机器学习中多是监督学习，也就是训练样本要给标签（正确的类别信息）；而聚类是在某种规则下自动将样本归类，在机器学习中是无监督学习，不需要提前给样本打标签。k-means聚类算法，就是在某种度量方式下，将样本自动划分到k个类别中去。
复制链接

扫一扫

sophia_xw CSDN认证博客专家 CSDN认证企业博客

码龄8年

153: 原创

4万+: 周排名

186万+: 总排名

54万+: 访问

: 等级

4765: 积分

104: 粉丝

185: 获赞

135: 评论

772: 收藏

私信

关注

热门文章

分类专栏

other 1篇
机器视觉 4篇
docker 3篇
python 1篇
linux 3篇
cpp 2篇
算法工程化 1篇

最新评论

ubuntu1804解决libjasper-dev无法安装
AkiraZWX: 换为清华源
skimage.measure求最大连通区域
看遍世间繁华: 输出：(0, 0, 6, 6) 0
Use Custom Datasets
bj_zhb: 你好，想请教一下，在annotation字段，如果我只做分割任务，不做检测任务，bbox和bbox_mode可以不设置这两个key吗？我看官方文档中写的是required，但是我的自定义数据集中没有关于检测的标注，谢谢
MATLAB读json文件
m0_72280953: 错误使用 loadjson>error_pos (line 623) JSONLAB:JSON:InvalidFormat: String starting with " expected at position 24049: ntTwin": { <error>//鍙傝€冩爣鍑嗙幆澧冨鐢熶綋妯″瀷出错 loadjson>parseStr (line 454) pos=error_pos('String starting with " expected at position %d',inputstr,pos); 出错 loadjson>parse_object (line 585) [str, pos, index_esc] = parseStr(inputstr, pos, esc, index_esc, varargin{:}); 出错 loadjson>parse_value (line 542) [varargout{1:nargout}] = parse_object(inputstr, pos, esc, index_esc, varargin{:}); 出错 loadjson>parse_object (line 597) [val, pos,index_esc] = parse_value(inputstr, pos, esc, index_esc, varargin{:}); 出错 loadjson (line 236) [data{jsoncount},pos,index_esc] = parse_object(inputstr, pos, esc, index_esc,opt); 出错 duqu (line 6) jsonData=loadjson(file_name); 你好想问一下这是什么问题
detectron2训练报错
你的男孩坏坏: 请教一下博主,修改的部分在哪块添加了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

sophia_xw 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。