用R语言实现简单的Kmeans聚类

最新推荐文章于 2024-03-09 17:37:52 发布

goskiller

最新推荐文章于 2024-03-09 17:37:52 发布

阅读量1.1w

点赞数 2

分类专栏： R语言算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28887735/article/details/52712180

版权

R语言同时被 2 个专栏收录

13 篇文章 0 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

最近主要在做针对投资者的统计及聚类分析，希望能找出投资者的一些特征，方便做投资者的精准营销。

首先使用的是SPSS的modeler，毕竟操作可视化，比较简单，就是运行大量数据比较慢，挺费时间。

后来又想用R验证一下聚类的准确性，直接登陆Rstudio，找了kmeans的包，也计算了，发现了SPSS聚类除了没有R计算的效率快，分类也没有R精准，彻底断了我继续使用SPSS的想法，现将R聚类分析过程分享一下，大家一起学习共勉。

原始数据如下：

我需要使用R对这群投资者（约10W）进行聚类分析，代码如下：

library(kernlab)
library(magrittr)
#读取数据
zjd<-read.csv("d:/Rdata/zjd/zjd.csv",header = T,encoding = 'utf8')
zjd[is.na(zjd)]<-0
zjd[] <- lapply(zjd, as.numeric)

#设定聚类数并运行模型
res <- kmeans(zjd,5)
#将结果与原数据拼接
zjd1<-cbind(zjd,res$cluster)
#导出数据
write.csv(zjd1,file = 'd:/Rdata/zjd/zjd1.csv')

这里面还有一个问题，聚类数5是如何确定的？

我是先用SPSS自动聚类之后，挑选轮廓（就是覆盖程度）比较大的模型（就是kmeans），以及分类数（就是5）来作为这次的聚类方向做的。

关于kmeans的用法，我知道有一个指标设置中心的计算方法；

另外针对结果有三个重要指标：

$cluster——聚类结果

$centers——各聚类中心坐标

$size——各聚类数量

就是在结果后面加上指标就行，如我输入res$size，得到100000.

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
用R语言实现简单的Kmeans聚类

最近主要在做针对投资者的统计及聚类分析，希望能找出投资者的一些特征，方便做投资者的精准营销。首先使用的是SPSS的modeler，毕竟操作可视化，比较简单，就是运行大量数据比较慢，挺费时间。后来又想用R验证一下聚类的准确性，直接登陆Rstudio，找了kmeans的包，也计算了，发现了SPSS聚类除了没有R计算的效率快，分类也没有R精准，彻底断了我继续使用SPSS的想法，现将R聚类分析过程
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。