机器学习-K-Means聚类算法的实现(含tensorflow实现版)

最新推荐文章于 2024-06-21 18:08:46 发布

idotc

最新推荐文章于 2024-06-21 18:08:46 发布

阅读量870

点赞数 4

分类专栏：机器学习文章标签：机器学习深度学习手写实现

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_21578849/article/details/94448751

版权

机器学习专栏收录该内容

13 篇文章 1 订阅

订阅专栏

一、概述

K-means算法是集简单和经典于一身的基于距离的聚类算法采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。该算法认为类簇是由距离靠近的对象组成的，因此把得到紧凑且独立的簇作为最终目标。

二、k-means算法流程

在这里插入图片描述
结合代码具体分析流程：

1. 准备数据，对数据进行可视化显示
在这里插入图片描述

2.定义距离函数，聚类中心更新函数，实现k-means

计算聚类中心与样本之间的距离函数
根据距离记录列表record更新聚类中心
聚类算法指定运行n个epoch或者聚类中心不变则停止
得到聚类中心结果
可视化查看结果

代码传送门**（含tensorflow实现版）**

三、缺点

计算量大，样本量大时非常耗用计算资源；
不好确定K值，只能多次尝试，根据肘部法则去确定一个合适的K值；
不一定每次都能聚类好。可以记录一个距离的损失值，选择最后最小的损失值作为聚类中心；
不能聚类密度类数据，如两个环状的数据，这时候使用K-means将会失效。可以选择使用DBSCAN算法聚类。

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。