协方差可以表示不同变量之间的依赖关系,若两个变量正相关(即一个增大另一个也随着增大,减少亦同),则协方差的为正;若两个变量负相关(即一个增大则另一个减小的情况或反过来一个减小另一个增大的情况),则他们上午协方差为正。现假设变量x与y对应分别有n个值(即长度为n的一维向量),则x与y的协方差的具体数学定义形式如下(当x与y为同一变量时,协方差即为方差;若要满足无偏抽样,则分母取n-1):
相关系数则是将协方差矩阵压缩到[-1,+1]区间,使得两个变量之间的相关性更加容易衡量,而不容易受变量取值范围的影响。具体的,相关系数r的定义如下:
其中:σ对应变量x与y的标准差,以x为例,变量x对应的方差公式如下:
标准差即为方差开平方根后的结果。