R语言也是目前常用的数据分析编程语言之一,目前经过使用者、科学家们的开发,其功能也比较强大。本文就使用R语言中的corrplot来绘制相关系数矩阵热图进行介绍。
数据集有506个观测样本,14个变量:
image.png
首先,将数据导入R软件中:
> mydata
> summary(mydata)
然后计算相关系数,并下载相关系数矩阵corrplot包:
> res
> install.packages("corrplot") #下载相关系数矩阵corrplot包
> corrplot(res, method = "shade",shade.col = NA, tl.col ="black", tl.srt = 45, order = "AOE") # 绘制相关系数矩阵图
得到图形:
image.png
相关系数图中颜色越深表示,两个变量间的相关系数越接近1.图中可以看到,Boston的中位数房价(MEDV)一列中,与LSTAT、PTRATIO、RM等变量间的相