K-means算法

Zero-place

于 2021-01-16 21:39:00 发布

阅读量563

点赞数

分类专栏：大数据与机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41877184/article/details/112724586

版权

大数据与机器学习专栏收录该内容

2 篇文章 2 订阅

订阅专栏

K-means是一种无监督聚类算法，通过距离计算将数据分为k个类簇。算法包括选择k值，随机初始化质心，不断迭代更新直到满足停止条件。其优点是简单，但易受初始值影响，且仅适用于球形类簇。适用于数据挖掘和分类任务。

摘要由CSDN通过智能技术生成

目录

K-means算法简介

聚类大致步骤与结果(图)

算法具体步骤

相关计算(略)

算法优缺点

K-means算法简介

k-means算法是一种基于划分的聚类算法，过程为无监督过程。以距离作为数据对象间相似性度量的标准，即数据对象间的距离越小，则它们的相似性越高，则它们越有可能在同一个类簇。数据对象间距离的计算有很多种，k-means算法通常采用欧氏距离来计算数据对象间的距离。

聚类大致步骤与结果(图)

通俗解释：将没有标注(不含标签) 的数据进行聚类算法，就能得到分过组的分类数据。

算法具体步骤

1、自主选择要划分为类的个数k；
2、第一次将随机生成k个数据点作为聚类中心；
2、计算其他点到这k个聚类中心的距离(每个点要计算k次)，从而每个点都能得到唯一离得最近的聚类中心；
3、由此划分出了k个簇(类)；
4、此时重新计算每个簇(类)的质心作为新的聚类中心;
5、计算其他点到这k个聚类中心的距离(每个点要计算k次)，从而每个点都能得到唯一离得最近的聚类中心；
6、持续进行步骤4、步骤5的方法，直到满足停止条件。

注：迭代的停止条件大致有3种

设定迭代次数
聚类中心不再变化
前后两次聚类结果的目标函数的函数值变化很小

相关计算(略)

簇中心计算
距离计算(推荐使用欧式距离)

算法优缺点

优点：简单

缺点：1、初始值影响过大。事先并不知道k值如何选取，并且初始随机产生的聚类中心对最终的聚类结果也有很重要的影响；
2、复杂度与样本呈现线性关系
3、只能发现球型类簇，有些簇是得不到的。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Zero-place CSDN认证博客专家 CSDN认证企业博客

码龄7年

199: 原创

17万+: 周排名

61万+: 总排名

43万+: 访问

: 等级

4591: 积分

160: 粉丝

466: 获赞

84: 评论

2515: 收藏

私信

关注

分类专栏

最新评论

机器学习-泛化能力
飞天与呱呱魔王: 感谢，帮我解决了问题。
Java完成密码找回功能
m0_64386068: 大佬我想问一下，这个找回密码的意思就是又从数据库查了一遍然后通过邮件提示密码并且显示成功吗？(表面工作，不是我们想的删除密码，数据还保存在数据库里没有动过，只是我们个人忘记而已，对吗？)
C语言完成图书管理系统
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/8014355, 请多输出高质量博客, 帮助更多的人
机器学习-泛化能力
lluckyu: 太牛了，通俗易懂！
C语言实现进制转换(详)
Медный всадник: 这两个都有些小问题，对于第一个16进制往回转的时候没法转（读取不了ABC....），第二个则是10转到16进制了没法输出（输出不了ABC....）所以就第一个问题我感觉可以这样写： #include<stdio.h> #include<string.h> int main() { char a[100]; int n,k,i; int y=0; int p=1; scanf("%s %d",&a,&k); n=strlen(a); for(i=n-1;i>=0;i--) { if(a[i]>='A'&&a[i]<='F') { a[i]=a[i]-'A'+10; }else{ a[i]=a[i]-'0'; } y += a[i] * p; p *= k; } printf("%d",y); return 0; } 第二个可以这样： #include<stdio.h> int main() { int x,k,i; int a[1000]; scanf("%d %d",&x,&k); int n=0; do{ a[n++]=x%k; x=x/k; }while(x!=0); for(i=n-1;i>=0;i--) { if (a[i] <= 9) { printf("%d", a[i]); } else { printf("%c", a[i] - 10 + 'A'); } } return 0; }

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。