今天分享一个相关分析可视化实战!
之前我们分享了关于相关分析的原理,还有ggcorrplot包的使用。
相关性分析方法基础:Spearman、Kendall和Pearson
R相关矩阵可视化包ggcorrplot
今天推出相关分析的第三讲,corrplot实战与绘图。
corrplot简介与安装
corrplot是一个绘制相关矩阵和置信区间的包,它也包含了一些矩阵排序的算法。
安装也非常简单,如果在Rstudio中,直接安装:
install.packages("corrplot")
本节选学内容,让工作体验更美好!
如果使用rstudio的数据源下载太慢,可以使用国内清华镜像安装,反正我在科技网,或方正宽带下载都会快10倍以上。
install.packages("corrplot",
repos="https://mirrors.tuna.tsinghua.edu.cn/CRAN")
此外还可以devtools工具从作者的github源安装,名称为taiyun/corrplot
,追求最新版本的朋友自行尝试,这里不再赘述。
简单的相关分析及绘图实例
我们library
加载包,使用cor
计算内部数据mtcars
汽车数据列间相关系数矩阵,再绘图。
library(corrplot)
M = cor(mtcars)
corrplot(M, order = "hclust", addrect = 2)
简单三句话,美美哒相关分析结果是出来了。
实例精华讲解
我们现在对原始数据、分析结果和可视化参数进行解释。
我们看一下输入数据格式:使用head查看数据前6行预览:
head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1
本质上是一个行为样本名,列为属性的数值表格。其实我们大部分的数据都是这种格式的文件,只需要使用read.table
读入。
cor
函数对mtcars
数据按列进行两两相关性计算,默认使用pearson
方法,当然理论解读中提前的spearman
和kendall
方法也都支持。
比如我们选spearman
方法计算相关系数矩阵:
cor(mtcars, method = "spearman&#