概述:
pearson相关系数用于比较两组变量是否线性相关,比如{a1,a2,a3,a4}与{b1,b2,b3,b4}他们都是同增加或者同减少,那么他们就是相关的。
取值:
相关系数的取值为-1<r<1,为0时表示不相干,正数的时候为正相关,负数的时候为负相关,如下所示:
|r|取值与相关程度的关系如下所示:
适用条件:
1、两变量均应由测量得到的连续变量。
2、两变量所来自的总体都应是正态分布,或接近正态的单峰对称分布。
3、变量必须是成对的数据。
4、两变量间为线性关系。
计算方法:
其中
为x取值的平均值
因为样本和总体存在误差,因此对样本计算的结果还要进行假设检验
用途:
1.两组观察值是否有关系
2.两用户的两组评分那么他们是否相似