相关系数图是什么?
对于数据集进行描述性统计分析后,通常需要对变量间的相关关系进行考察
相关系数图可用于可视化变量间相关关系的方向、大小和密切程度,在相关系数图中,相关系数(correlation coefficients) 根据不同的系数值赋予了不同的颜色或形状,相关系数矩阵(correlation matrix) 则根据不同的颜色或形状将变量间的相关关系直观的展示出来
第一步 安装并载入corrplot包
install.packages("corrplot") #安装corrplot包
library(corrplot) #载入corrplot包
?corrplot #查看帮助文档
第二步 读取Excel文件
library(readxl) #载入readxl包,首次使用需先安装
data <- read_xlsx("C:/Users/dell-pc/Desktop/data.xlsx", sheet = "data") #读取Excel文件指定sheet的数据
head(data,10) #输出前10行数据
第三步 计算相关系数
corr <- cor(data) #计算变量间的相关系数,默认为Pearson相关系数
round(corr,3) #输出相关系数矩阵,并保留三位小数
第四步 绘制并输出相关系数图
corrplot(corr, method = "circle") #以circle形式输出相关系数图
method:指定图形的样式,可以是"circle", "square", "ellipse","number", "shade","color","pie"
(选做)第五步 调整图形部分设置
corrplot(corr, method = "circle",tl.col = "black",tl.srt = 0,type = "upper")
tl.col:指定坐标轴标注的颜色
tl.srt:指定坐标轴标注的旋转方向
type:指定图形的排布,可以是"full","lower","upper"
(选做)第六步 设置图形分级颜色
library(RColorBrewer) #载入RColorBrewer包,需先安装
corrplot(corr, method = "circle",tl.col = "black",tl.srt = 0,
type = "upper",col=brewer.pal(n=10, name="RdYlBu")) #按RdYlBu配色方案分10级设置颜色
(选做)第七步 混合图形样式
corrplot.mixed(corr,upper="color",lower="number",tl.col = "black") #默认样式为upper="circle",lower="number"