基础理论:
相关分析:描述定量变量间的关系。
pearson相关:变量间的线性相关程度;
spearman相关:衡量分级定序变量间的相关程度;
kendall相关:非参数的等级相关度量。
R语言常用函数:cor(),默认结果为矩阵
cor(mydat,use=,method=) #use 缺失值的处理,method 处理方法
cor(x,y) #可以计算非方形矩阵,x y分别为2个矩阵,相同的行数
相关性的显著性检验,常用函数cor.test(),单次仅比较2个变量,延伸:psych包中的corr.test() 可以计算所有的变量的相关性是否显著
cor.test(x,y,alternative=,method=) #x y为检验相关性的变量
library('psych')
corr.test(mydat)
相关性分析可视化常用包:
corrplot
heatmap
PerformanceAnalytics
library('openxlsx')
library('corrplot')
library('PerformanceAnalytics') #另一个可视化包
mydat<-read.xlsx('aa.xlsx',colNames = T,sheet = 1)
cor<-cor(mydat) # 常规相关性分析
corrplot(cor) #直接出图 默认圆形显示
![985ddac3b9fe854854370ab22eb17e66.png](https://i-blog.csdnimg.cn/blog_migrate/05b5f1d5eb99204a390b83efd0f90aad.jpeg)
corrplot(cor,method="color",addCoef.col="grey") #用颜色显示,同时显示相关系数
![d5a0f716817c4d29edd8d485f089cdc1.png](https://i-blog.csdnimg.cn/blog_migrate/3e00b27440ece37c297d40c830765012.jpeg)
corrplot(cor,order = "AOE",type="upper",tl.pos = "d")
corrplot(cor,add=TRUE, type="lower", method="number",
order="AOE",diag=FALSE,tl.pos="n", cl.pos="n")
![829f061c7a6f5f644152efdfdc9f2d66.png](https://i-blog.csdnimg.cn/blog_migrate/521276a5b8240d7beb83932317de3cd6.jpeg)
library('PerformanceAnalytics') #####用于将相关性的分析结果可视化
cor<-cor(mydat,method = "pearson")
chart.Correlation(mydat,histogram = TRUE,pch=15) ####各种参数可以根据个人需要调整
![4d3f80939eaa17d85bb480f1e19838f9.png](https://i-blog.csdnimg.cn/blog_migrate/a789bd466ee5629dd5d2b5acd09e2c67.jpeg)