一、相关系数的定义
还记得我们在上一篇 B l o g Blog Blog 里面关于相关系数的定义嘛? ρ = C o v ( X , Y ) D X D Y = E ( X Y ) − E X E Y D X D Y ρ = \frac{Cov(X, Y)}{\sqrt{DX}\sqrt{DY}} = \frac{E(XY) - EXEY}{\sqrt{DX}\sqrt{DY}} ρ=DXDYCov(X,Y)=DXDYE(XY)−EXEY
我们可以证明: ∣ ρ ∣ ≤ 1 |ρ| ≤ 1 ∣ρ∣≤1
二、相关系数——到底是什么相关?
我们有下面的关系:
若
∣
ρ
∣
=
1
|ρ| = 1
∣ρ∣=1,则我们说
X
,
Y
X, Y
X,Y 是以 P = 1 呈线性关系(简单理解就是线性关系)
所以,我们说:相关系数其实真正衡量的就是 X, Y之间的线性关系的强弱。
那么,既然是
∣
ρ
∣
=
1
|ρ| = 1
∣ρ∣=1,那么也就是说
ρ
ρ
ρ 可以等于+1 或者 -1.
【1】当
ρ
=
+
1
ρ=+1
ρ=+1 时,我们说 X, Y 呈正相关
【2】当
ρ
=
−
1
ρ=-1
ρ=−1 时,我们说 X, Y 呈负相关
【3】当
ρ
ρ
ρ 接近0时,我们说 X, Y 的线性关系很弱了
【4】当
ρ
=
0
ρ = 0
ρ=0 时,我们说 X, Y 不存在线性关系
三、不相关与独立之间的关系辨析
通过上面的分析,我们说可以把 ρ ρ ρ 理解成是线性相关系数。也即是说, ρ ρ ρ 反应的是 X, Y 二者的线性关系的强弱。那么,如果我们说 X , Y X, Y X,Y 不相关,意思就是说 : X , Y X, Y X,Y 之间是没有线性关系的。但是,这并不代表 X , Y X, Y X,Y 之间就没有非线性关系。比如说,如果 X = Y 3 + s i n ( Y ) X = Y^3 + sin(Y) X=Y3+sin(Y),我们就认为这两个变量之间是没有线性关系的,但是它们之间确实存在一个非线性的关系!
而我们所说的 X , Y X, Y X,Y 独立,指的就是 X , Y X, Y X,Y 之间没有任何关系(这里指的关系包括线性关系和非线性关系)
因此,我们得出了下面的结论:若 X , Y X, Y X,Y 二者独立,那么 X , Y X, Y X,Y 之间一定不相关。反之,如果 X , Y X, Y X,Y 不相关, X , Y X, Y X,Y之间却不一定独立。
下面有一个非常非常特别的情况:就是二维的正态分布。对于二维正态分布而言,不相关和独立是等价的。
四、中心矩与原点矩
我们先给出定义:
原点矩:
E
X
k
EX^k
EXk;那么,一阶的原点矩为:
E
X
EX
EX就是期望。
中心矩:
E
(
X
−
E
X
)
k
E(X-EX)^k
E(X−EX)k;那么,一阶中心距就是:
E
(
X
−
E
X
)
=
0
E(X-EX) = 0
E(X−EX)=0;二阶中心矩就是:
E
(
X
−
E
X
)
2
=
D
X
E(X-EX)^2 = DX
E(X−EX)2=DX 就是方差。
其实计算的话,我们就把他当成一维随机变量函数的期望来求就OK了!