相关系数可用来衡量两个变量之间的相关性大小,根据数据满足的不同条件,选择不同的相关系数进行计算分析。
两种常用的相关系数:皮尔逊person和斯皮尔曼spearman。
总体和样本:
皮尔逊相关系数:(要求数据要都是符合正态分布的数据,而且数据需线性相关)
必须先确认两个变量时线性相关的(画样本散点图先观察是否线性),然后此系数才能告诉他们相关程度如何。如果计算的相关系数为0,只能说明非线性相关。
不能说协方差大的两个变量比协方差小的两个变量更相关,因为没有消除变量的量纲的影响。皮尔逊相关系数就是协方差消除量纲后的结果。
样本皮尔逊相关系数同总体皮尔逊相关系数: