方差、协方差
方差
方差一般写为:
σ
2
\sigma^2
σ2 或
V
a
r
(
x
)
Var(x)
Var(x)
σ
2
=
∑
(
X
−
μ
)
2
N
\sigma^2=\frac{\sum(X-\mu)^2}{N}
σ2=N∑(X−μ)2
X
X
X为统计数据,
μ
\mu
μ为样本均值,
N
N
N为样本数.
方差描述样本偏离均值的程度,或者说是样本的分散程度。
协方差
协方差一般用
C
o
v
(
x
,
x
)
Cov(x,x)
Cov(x,x)表示
c
o
v
(
x
,
y
)
=
1
n
∑
i
n
(
x
i
−
μ
x
)
(
y
i
−
μ
y
)
cov(x, y)=\frac{1}{n}\sum_i^n(x_i-\mu_x)(y_i-\mu_y)
cov(x,y)=n1∑in(xi−μx)(yi−μy)
协方差表示了两个随机变量的一致的分散程度,将协方差进行归一化就可以得到两个变量的相关系数。
ρ
=
c
o
v
(
x
,
y
)
s
t
d
(
x
)
∗
s
t
d
(
y
)
\rho=\frac{cov(x,y)}{std(x)*std(y)}
ρ=std(x)∗std(y)cov(x,y)
其中,标准差
s
t
d
(
x
)
=
v
a
r
(
x
)
std(x)=\sqrt{var(x)}
std(x)=var(x)
方差与协方差的区别与联系
方差是一个随机变量的统计数据,协方差是两个随机变量的统计数据,若两个随机变量是相同的,则他们的协方差与方差相等。即 C o v ( x , x ) = V a r ( x ) Cov(x,x)=Var(x) Cov(x,x)=Var(x).
协方差的一些性质:
C
o
v
(
x
,
y
)
=
C
o
v
(
y
,
x
)
Cov(x,y)=Cov(y,x)
Cov(x,y)=Cov(y,x)
如果x,y相互独立,意味着两个变量之间没有任何关系,则
C
o
v
(
x
,
y
)
=
0
Cov(x,y)=0
Cov(x,y)=0