皮尔森相关系数公式
文字描述:相关性系数(Px,y)等于X,Y之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX,σY)
1. 先解释分子,为什么用协方差?
因为我们想要研究的两组数据的相关性,两个组数据如果相关的的话,要满足的最基本的条件:变化趋势相似(例如正相关或负相关)
而协方差就可以告诉我们这一点,协方差的公式为:
文字描述为:如果有X,Y两个变量,每个时刻的“X值与其均值之差”乘以“Y值与其均值之差”得到一个乘积,再对这每时刻的乘积求和并求出均值
如果X,Y的变化趋势是有规律的话,例如正相关,那么在X低于均值的时候,Y大概率也会低于均值;X高于均值的时候,Y大概率也会高于均值,所以两者相乘后的乘积大概率是正数(大量正数+少量负数),所以数学期望的话也是个正数,所以最后正相关的符号是正的