R语言进行系统聚类分析并作图(数据来源国家统计局)

系列文章目录

第一篇:R语言和RStudio安装,载入TXT、CSV和XLSX(利用RODBC)文件



前言

本文讲述如何到国家统计局采集数据,并利用R语言进行系统聚类分析的过程。


一、国家统计局采集数据

进入国家统计局,在顶部菜单栏的统计数据处,选择数据查询,进入国家数据.
在这里插入图片描述
本文使用的数据是2016年我国各省市运输线路长度(铁路营业里程+公路营业里程)。
在顶部菜单导航栏选择“地区数据-分省年度数据”,在左侧的菜单栏先选择“指标-运输与邮电-铁路线路长度”,再选择“地区-全部地区”,在筛选条件处指标设置为铁路营业里程(万公里),时间设置为2016,导出为csv文件。接下来导出公路营业里程的数据文件。
对表格进行处理,铁路线路长度=铁路营业里程+公路营业里程。将文件命名为dataone.csv。
在这里插入图片描述
在这里插入图片描述

二、用R语言对数据进行系统聚类分析

1.载入数据文件

注意,此处文件的编码方式默认是GBK,毕竟是政府网站导出的数据。

data<-read.csv("D:/dataone.csv",fileEncoding = "GBK")

2.计算距离矩阵和最长距离法聚类

distance <- dist(data)  #计算距离矩阵
data.hc <- hclust(distance) #最长距离法聚类

3. 绘制谱系图

plot(data.hc, hang = -1) #绘制谱系图
re <- rect.hclust(data.hc, k = 5) #分为5类

在这里插入图片描述

4. 显示聚类结果

for (i in 1:5) {
print(paste("第",i,"类"))
print(data[re[[i]],]$地区)
}

在这里插入图片描述


总结

以上就是用R语言对国家统计局采集的“2016全国各省市运输线路长度”数据的系统聚类分析过程。

  • 15
    点赞
  • 151
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值