机器学习把我整的有点蒙了,今天写点简单的。
什么是相关系数矩阵?
其实这个东西在数据分析中经常用到,相关系数矩阵可以一次性同时显示多个变量之间的相关关系。当我们做相关系数矩阵时,我们会得到一个包含每个变量与其他变量之间的相关系数的表。表中的系数显示了关系的强度及其方向(正或负相关)。在Python中,我们可以使用Pandas和NumPy创建相关系数矩阵。
相关矩阵的应用
在写代码之前呢,再给大家明确一下什么时候我们需要创建相关系数矩阵:
- 如果我们有一个大数据集,并且打算探索数据模式。
- 将相关系数矩阵用于其他统计方法。例如,在进行探索性因子分析,验证性因子分析,结构方程模型时都要以相关矩阵作数据。
- 其他的统计方法,比如回归分析的诊断也可能用到相关矩阵。
相关的种类
相关的种类也有很多,常用的就是Pearson的乘积矩相关。根据变量的数据类型,还有数据遵循相关假设的不同,还有其他常用的方法,例如Spearman相关和Kendall相关。在这儿给出3位大佬的图片,具体什么时候用哪种相关,请自行搜索。