机器学习：R实现k-means算法做画像

最新推荐文章于 2022-05-30 19:00:00 发布

daydayup8888

最新推荐文章于 2022-05-30 19:00:00 发布

阅读量940

点赞数

分类专栏： R 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/daydayup8888/article/details/89295940

版权

机器学习同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1.K-means应用场景：
K-means算法通常可以应用于维数、数值都很小且连续的数据集，比如：从随机分布的事物集合中将相同事物进行分组。
具体可参考：
https://blog.csdn.net/yunqiinsight/article/details/80134331
2.K-means算法原理：
K-means算法是根据数据点之间的欧氏距离进行聚类的，是一种无监督学习算法，步骤要点是：

选择一个聚类数k，迭代次数n
随机选择K个点作为初始簇中心
计算周围节点与这K个点的欧式距离，距离近的加入该点形成的簇，得到初始簇
对初始簇计算质心，作为下一轮簇中心，再进行聚类，然后再计算质心
重复之心第4步，直到迭代次数结束，形成最终簇和最终簇中心。

那么详细的计算过程可以参考https://www.cnblogs.com/pinard/p/6164214.html：
3.k-means算法R实现：
1）对导入的数据进行格式转化
由于k-means算法根据欧式距离判断数据点归属哪个类，故需要将数据转化成数值型。若存在字符形式的，需先转化成因子型，再转化为数值型。
在这里插入图片描述
2）对数据做标准化处理
数据之间量纲不一致导致数据无法对比，需要进行标准化处理，使用scale（）函数将数据标准化为均值是0，方差是1的数据。

3）加载相关聚类包

一定要设置随机数种子，因为k-means最开始是随机找初始簇中心。
set.seed(123)
4）验证数据是否是高度可聚合
若输出值<0.5，则表示该数据是高度可聚合的。
在这里插入图片描述
5）输出最优聚类数

6）进行k-means聚类

7）模型评估
8）结果解析

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习：R实现k-means算法做画像

K-means算法结论：K-means算法原理：k-means算法R实现：
复制链接

扫一扫

专栏目录

daydayup8888 CSDN认证博客专家 CSDN认证企业博客

码龄7年

19: 原创

34万+: 周排名

11万+: 总排名

3万+: 访问

: 等级

557: 积分

26: 粉丝

45: 获赞

10: 评论

118: 收藏

私信

关注

热门文章

分类专栏

R语言 4篇
数据分析 1篇
hive 1篇
原创 1篇
机器学习 3篇
R 1篇
数据机构 1篇

最新评论

AB测试最小样本量
全栈小5: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰，图文并茂，详略得当，期待博主持续输出好文！三连支持【AB测试最小样本量，博主这篇文章，值得一看】
AB测试最小样本量
CSDN-Ada助手: 恭喜您撰写了第18篇博客！标题“AB测试最小样本量”非常吸引人。您对于AB测试的关注点非常实用，对于确定最小样本量这一关键问题提供了有价值的见解。希望您能继续分享关于AB测试的经验和技巧，比如如何选择合适的统计方法或者如何解读实验结果。同时，也期待您能深入研究其他与数据分析相关的主题，为我们带来更多有趣的内容。再次恭喜您，并期待您的下一篇博客！
R语言-检验正态性
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数；(3)使用更多的站内链接。
R语言ggplot画双坐标-柱状图、折线图
bfy456: 这个ggplot，在哪个包里2
R数据结构
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用标准目录；(2)使用更多的站内链接；(3)增加条理清晰的目录。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。