R语言数据分析 | 谱系图与聚类分析

本文介绍了使用R语言进行谱系图和聚类分析的方法,包括hclust()函数、ape包以及A2R包的使用,详细讲解了计算距离、聚类方法以及不同形式的谱系图可视化技巧。示例数据为2020年中国31个省份的人均GDP和年末常住人口数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

谱系图是层次聚类分析中一种常见形式,聚类分析是指在n维空间中将点分配到类的一种方法。本文对R语言中绘制谱系图的绘图函数及相关package进行汇总,展示不同形式的谱系图绘制过程。

1.数据准备

以国家统计局[1]官方网站上关于2020年我国31个省份人均GDP【单位:元】及年末常住人口【单位:万人】数据(未包含港澳台数据)为例,通过聚类分析构建谱系图。数据如下图所示,可在后台回复【20220114】获取。

2.数据处理

前期数据处理主要包括读入数据、为数据指定行名、选择待分析的数据列、对数据进行标准化等。

setwd("C:\\Users\\Acer\\Desktop") #设置工作路径
data <- read.csv("hclust.csv") #读入数据
head(data) #查看数据前几行
#  province Per.GDP  POP
#1     北京  164889 2189
#2     天津  101614 1387
#3     河北   48564 7464
str(data) #查看数据结构
#'data.frame': 31 obs. of  3 vari
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mrrunsen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值