在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。
期望值分别为E(X) = μ 与 E(Y) = ν 的两个实数随机变量X与Y之间的协方差定义为:
COV(X,Y)=E[(X-E(X))(Y-E(Y))]
如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。
如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。
如果X与Y是统计独立的,那么二者之间的协方差就是0。
但是,反过来并不成立。即如果X与Y的协方差为0,二者并不一定是统计独立的。
----------------------------------------------------------------------------------------------------------------
协方差虽然一定程度上描述了两变量的相关性,但协方差是具有量纲的量。
相关系数是一种与量纲无关的,描述随机变量之间的相关性的数字特征。
若随机变量XY的期望与方差都存在,称:
为XY的相关系数。
(1);
(2)定理: | ρXY | = 1的充要条件是,存在常数a,b,使得;
相关系数ρXY取值在-1到1之问,ρXY = 0时,
称X,Y不相关; | ρXY | = 1时,称X,Y完全相关,此时,X,Y之间具有线性函数关系; | ρXY | < 1时,X的变动引起Y的部分变动,ρXY的绝对值越大,X的变动引起Y的变动就越大, | ρXY | > 0.8时称为高度相关,当,即 | ρXY | < 0.3时,称为低度相关,其他为中度相关。