R语言数据分析 | 谱系图与聚类分析

谱系图是层次聚类分析中一种常见形式,聚类分析是指在n维空间中将点分配到类的一种方法。本文对R语言中绘制谱系图的绘图函数及相关package进行汇总,展示不同形式的谱系图绘制过程。

1.数据准备

以国家统计局[1]官方网站上关于2020年我国31个省份人均GDP【单位:元】及年末常住人口【单位:万人】数据(未包含港澳台数据)为例,通过聚类分析构建谱系图。数据如下图所示,可在后台回复【20220114】获取。

2.数据处理

前期数据处理主要包括读入数据、为数据指定行名、选择待分析的数据列、对数据进行标准化等。

setwd("C:\\Users\\Acer\\Desktop") #设置工作路径
data <- read.csv("hclust.csv") #读入数据
head(data) #查看数据前几行
#  province Per.GDP  POP
#1     北京  164889 2189
#2     天津  101614 1387
#3     河北   48564 7464
str(data) #查看数据结构
#'data.frame': 31 obs. of  3 variables:
# $ province: chr  "北京" "天津" "河北" "山西" ...
# $ Per.GDP : int  164889 101614 48564 50528 72062 58872 50800 42635 155768 121231 ...
# $ POP     : int  2189 1387 7
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mrrunsen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值