R语言全国区域经济聚类分析

书立行

已于 2023-04-19 16:44:30 修改

阅读量2.2k

点赞数 6

文章标签： r语言

于 2023-04-19 12:25:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/primebrake/article/details/130241287

版权

该文通过R语言对我国31个地区的发展状况进行聚类分析，使用了包括欧氏距离在内的六种类间距离进行系统聚类，并绘制了聚类图。接着，应用KMeans算法，基于标准化数据选择3作为最佳聚类数，分析了不同类别的特征，如第三类城市在某些因素上表现突出。此外，还展示了各组因素的密度分布情况。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

实验任务：

请根据表1给出的16个因素对我国31个地区的发展状况进行聚类分析。

请用六种类间距离进行系统聚类，并绘制聚类图
请对16个因素采用kmeans聚类法分析我国31个地区的发展状况

实验步骤：

1.用六种类间距离进行系统聚类，并绘制聚类图

①读取上方表格的数据

library(openxlsx)

read.xlsx("C:\\Users\\Dell\\Desktop\\多元统计和r语言\\shiyansi.xlsx")

X=read.xlsx("C:\\Users\\Dell\\Desktop\\多元统计和r语言\\shiyansi.xlsx",rowNames=T)

②将因素进行分类

colnames(X)=c("y","x1","x2","x3","x4","x5","x6","x7","x8","x9","x10","x11","x12"

,"x13","x14","x15","x16")

D=dist(X,method="euclidean",p=2)

③最短距离法（采用欧氏距离）

a=hclust(D,method = "complete")

plot(a)

④最长距离法（欧氏距离）

b=hclust(D,method = "complete")

plot(b)

⑤ward（欧氏距离）

c=hclust(D,method="ward.D2")

plot(c)

⑥中间距离法

d=hclust(D,method="median")

plot(d)

⑦类平均法（欧氏距离）

e=hclust(D,method="average")

plot(e)

⑧重心法（欧式距离）

f=hclust(D,method="centroid")

plot(f)

2.请对16个因素采用kmeans聚类法分析我国31个地区的发展状况

①安装并且加载包

#install.packages("factoextra")

#install.packages("cluster")

#install.packages("NbClust")

#install.packages("dplyr")

#install.packages("pacman")

#加载包

library(factoextra)

library(dplyr)

library(cluster)

library(pacman)

library(NbClust)

names(X)

②标准化数据

X.scaled<-scale(X[2:16])

③通过NbClust函数的投票功能进行聚类数选择

L=NbClust(X.scaled,distance="euclidean",method="average")

table(L$Best.n[1,])#k值选择3

win.graph(width=6, height=5,pointsize=9)#写这行解决figure margins too large报错

barplot(table(L$Best.n[1,]),xlab = "No. of cluster")

根据投票结果，发现3应该票数最多，选择3为聚类数，即k值

④选择聚类数为3

kmeans1<-kmeans(X.scaled,centers=3,nstart = 25)

fviz_cluster(object=kmeans1,data=X[2:17],

ellipse.type = "euclid",star.plot=T,repel=T,

geom = ("point"),palette='jco',main="",

ggtheme=theme_minimal())+

theme(axis.title = element_blank())

⑤进行归类

summary(kmeans1)

kmeans$cluster

kmeans$size

⑥对每组数据进行平均值统计

summarize(by_fenzu,x1=mean(x1),x2=mean(x2),

x3=mean(x3),x4=mean(x4),x5=mean(x5),x6=mean(x6),x7=mean(x7),x8=mean(x8),x9=mean(x9)

,x10=mean(x10),x11=mean(x11),x12=mean(x12),x13=mean(x13),x14=mean(x14),x15=mean(x15),

x16=mean(x16))

分析：在因素1，2，3，4，5，6，8，9中，第三类城市表现突出，在因素7，11中，第一类城市表现突出，在因素12中，第二类城市表现突出。

⑦对数据进行分组，得出每组因素的密度分布情况，这里以前五个因素为例

Data1=z[which(z$kmeans1.cluster==1),]

Data2=z[which(z$kmeans1.cluster==2),]

Data3=z[which(z$kmeans1.cluster==3),]

#因素1的分布曲线

par(mfrow=c(1,3))

plot(density(Data1[,1]),main="1.1")

plot(density(Data2[,1]),main="1.2")

plot(density(Data3[,1]),main="1.3")

#因素2的分布曲线

par(mfrow=c(1,3))

plot(density(Data1[,2]),main="2.1")

plot(density(Data2[,2]),main="2.2")

plot(density(Data3[,2]),main="2.3")

#因素3的分布曲线

par(mfrow=c(1,3))

plot(density(Data1[,3]),main="3.1")

plot(density(Data2[,3]),main="3.2")

plot(density(Data3[,3]),main="3.3")

#因素4的分布曲线

par(mfrow=c(1,3))

plot(density(Data1[,4]),main="4.1")

plot(density(Data2[,4]),main="4.2")

plot(density(Data3[,4]),main="4.3")

#因素5的分布曲线

par(mfrow=c(1,3))

plot(density(Data1[,5]),main="5.1")

plot(density(Data2[,5]),main="5.2")

plot(density(Data3[,5]),main="5.3")

#散点图矩阵

pairs(x1~x2+x3+x4+x5,data=z)[unclass(z$kmeans1.cluster)]

博客等级

码龄4年

18
原创

168
点赞

278
收藏

147
粉丝

关注

私信

热门文章

最新评论

H3C项目--HTML5+CSS3+Bootstrap3+少量js
ha_lydms: 给作者大大点赞！这是一篇优质好文，对我学习又有了信道帮助哦，复习好物，三连值得，内容详细易懂
CSS学习笔记Day5
CSDN-Ada助手: 恭喜您发布了第12篇博客“CSS学习笔记Day5”！持续学习和分享知识是非常难得的品质，希望您能够坚持下去。接下来，建议您可以尝试结合实际项目应用CSS知识，或者深入学习CSS的一些高级技巧，让您的博客内容更加丰富和有深度。加油！期待您更多精彩的创作！
CSS学习笔记Day6
CSDN-Ada助手: 恭喜你写了第13篇博客《CSS学习笔记Day6》！持续创作不易，你的努力和坚持让我深感钦佩。希望你能继续保持学习的热情，坚持不懈地分享自己的学习心得和经验。或许在下一篇博客中，你可以分享一些实战经验或者解决问题的方法，让读者更能从中受益。加油！期待你更多精彩的作品！
HTML学习笔记Day2
书立行: 可以的，互相学习
HTML学习笔记Day2
编程菜鸡儿: 博主写的真好，我能向您学习吗

大家在看

Neural Architecture Search (NAS) 实践：从组件构建到整体实现

最新文章

目录

展开全部

收起

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。