【R语言】聚类模型

最新推荐文章于 2024-04-29 06:00:00 发布

Vickie_wwq

最新推荐文章于 2024-04-29 06:00:00 发布

阅读量121

点赞数

分类专栏： R语言自学笔记文章标签： r语言聚类开发语言笔记

本文链接：https://blog.csdn.net/weixin_46155316/article/details/131483836

版权

R语言自学笔记专栏收录该内容

12 篇文章 3 订阅

订阅专栏

K均值聚类

#确定聚类数目：Elbow方法
kmax <- 10
Elbow <- sapply(1:kmax, function(k) kmeans(food[,-1],centers=k,nstart=10)$tot.withinss)
plot(1:kmax,Elbow,type='b',xlab='k',ylab='Total wss')

在这里插入图片描述

#确定聚类数目：Gap统计方法
library(cluster)
set.seed(123)
gap_stat <- clusGap(food[,-1],FUN=kmeans,K.max = 10,B = 50)
plot(gap_stat,xlab = "Number of clusters k")
abline(v=4,lty=2)

在这里插入图片描述

#构建聚类模型
set.seed(123)
food_km <- kmeans(food[,-1],centers = 3,nstart = 50)
food_km

在这里插入图片描述

#结果可视化
plot(data.frame(food[,2], food[,3]), col=food_km$cluster)
points(food_km$centers,pch=3,cex=2)

在这里插入图片描述

clusplot(food[,-1], food_km$cluster, color = T, labels = 2, main = 'Cluster Plot')

在这里插入图片描述

层次聚类

#计算距离
dist_data <- dist(food[,-1],method = "euclidean")
#进行层次聚类
hdata <- hclust(dist_data)
hdata
# Call:
# hclust(d = dist_data)
# 
# Cluster method   : complete 
# Distance         : euclidean 
# Number of objects: 25 
plot(hdata)
abline(h=30,lty=2)

在这里插入图片描述

Medoids聚类（PAM）

food_pam <- pam(food[,-1], 3)
food_pam
clusplot(food[,-1], food_pam$clustering, color = T, main = 'Cluster Plot')

在这里插入图片描述

clusplot(food[,-1], food_pam$clustering, color = T, main = 'Cluster Plot')

在这里插入图片描述

Vickie_wwq

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【R语言】聚类模型

本节用到的数据来源于25个欧洲国家的蛋白质摄入百分比，获取数据的链接是http://www.biz.uiowa.edu/faculty/jledolter/DataMining/protein.csv数据集包括25条数据、10个特征。
复制链接

扫一扫