常用的相关系数分为:皮尔逊person相关系数和斯匹尔曼spearman等级相关系数
首先其实知道协方差cov是可以得出变量的关系,但是这里的同等级的自变量之间无法进行比较,量纲不同
person系数就是根据协方差消除量纲而来,即将变量X、Y标准化后的协方差
1.person系数只是用来衡量两个变量线性相关程度的指标,注意是线性关系,假如系数不高,那只能说明不符合线性关系,不代表没有关系!
2.person系数的使用,必须是在你已经确定它们的关系是线性的情况下(比如看其散点图很明显是有线性关系的,才能person系数来说明他们线性相关程度的深浅
3.即使是非线性相关,其线性相关系数也很大,反过来,即使是线性相关,但存在离群点(异常值),其系数也会很小
4从第3点衍生,即使两个变量相关系数很大,也不代表其有线性关系,可能是存在异常点的非线性关系
所以,一定要画出散点图来看看其是否符合线性关系再从person系数来看,不符合就不用看下去了,符合才能看大小来判断符合程度
所用代码:R = corrcoef(x);
斯皮尔曼相关系数:R=corr(x,'type','spearman')
斯皮尔曼聚焦于等级测序,注重于逻辑,应用范围广,而person相关系数只能用在正态分布、线性关系、连续数据中