聚类算法Kmeans

最新推荐文章于 2022-03-24 22:03:16 发布

CrazyBuLLo

最新推荐文章于 2022-03-24 22:03:16 发布

阅读量462

点赞数

分类专栏：机器学习文章标签：聚类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40522828/article/details/88782555

版权

K-Means是一种常见的无监督学习算法，用于将相似的数据分到同一组。它需要预先设定簇的数量（K值），并基于质心（均值）和距离度量（如欧氏距离或余弦相似度）进行聚类。虽然简单且快速，但K值的选择和对初始值的敏感性是其主要挑战。此外，K-Means在处理非凸形状的簇时表现不佳，常用于图像压缩等场景。

摘要由CSDN通过智能技术生成

聚类算法Kmeans

聚类概念：
无监督问题：我们手里没有标签了
聚类：相似的东西分到一组
难点：如何评估，如何调参

K-MEANS算法基本概念：
要得到簇的个数，需要指定K值
质心：均值，即向量各维取平均即可
距离的度量：常用欧几里得距离和余弦相似度（先标准化）
欧氏距离就是点到点的距离

数据标准化是指当一组数据X浮动很小，另一组数据y浮动很大时，机器会认为X没什么作用，y的作用很大，这是就要对y进行标准化，将它的值的范围变得和x差不多，
在泰坦尼克号案例中也曾进行数据标准化

优势：简单，快速，适合常规数据集
劣势：K值难确定
复杂度与样本呈线性关系（样本点很多就会很复杂，因为每次迭代都要计算一次每个点与中心点之间的距离）
很难发现任意形状的簇

K_means算法对初始值的要求很高，初始值不好，分出来的效果会很差.

使用Kmeans进行图像压缩
对老虎像素点进行聚类
每个像素点取值都在0-255，就是有256种可能，现在通过聚类，将256种可能性压缩一半，压缩成128种可能性

例子：
由于老虎图像太大，先用一张比较小的图片来测试

In

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

CrazyBuLLo CSDN认证博客专家 CSDN认证企业博客

码龄7年

27: 原创

53万+: 周排名

173万+: 总排名

3万+: 访问

: 等级

614: 积分

25: 粉丝

17: 获赞

10: 评论

137: 收藏

私信

关注

热门文章

分类专栏

服务器 3篇
python 4篇
Node.js
机器学习 6篇
javascript 1篇
深度学习
django 5篇
算法 2篇
docker 1篇
数据库 1篇

最新评论

爬取安居客租房信息，主要是获取电话号码
2401_84309156: 你好我这边有个工程你看看能不能搞得定，58同城旗下的微聊产品app，登录的时候后端提示需要验证码验证，需要跳开这个步骤，以前只需要前段认证，就是所属地的ip认证，现在前段认证完以后还需要后端认证，搞的定私聊我
用django搭建个人博客(一)
芜湖123: 那个homepage要写两个吗
python中的魔法函数
Zzzzzj_bai: 这不就是c++的构造器和析构器加上运算符重载吗
爬取大众点评美食店铺信息，解密_token的思路
.含笑.: 不对呀，是更新了吗
用django搭建个人博客(一)
筱·铭回复瓦个林北: 我用的3.*版本的django遇到过类似的问题, 需要在models添加数据表的地方添加 [code=python] objects = models.Manager() [/code] 还有一步放到后面去了, 要显示首页, 得先将homepage添加到主页引导去, 在urls.py的urlpatterns添加 [code=python] path('', homepage), [/code]

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。