期望与方差
1.数学期望
数学期望是概率论中的一个重要概念,它描述了一个随机变量的平均值或中心值。数学期望也被称为期望值或均值。它是对随机变量可能取值的加权平均,其中权重是每个可能取值的概率。
1.1 离散型随机变量的期望
对于离散随机变量 X ,其可能的取值为 x1,x2,…,xn,对应的概率为
P
(
X
=
x
i
)
=
p
i
P(X=x_i)=p_i
P(X=xi)=pi
,则 X 的数学期望定义为:
E
(
X
)
=
∑
i
=
1
n
x
i
p
i
E(X)=∑_{i=1}^nx_ip_i
E(X)=i=1∑nxipi
其中 xi是随机变量 X 的可能取值,pi是 X取值为 xi的概率。
例子
1.有三个人的体重分别为150、165、180,求体重的期望值。
解:
三个人体重的概率相等,都是1/3,所以期望值:
E
X
=
1
3
×
150
+
1
3
×
165
+
1
3
×
180
=
165
EX=\dfrac{1}{3}\times 150 + \dfrac{1}{3}\times 165+ \dfrac{1}{3}\times 180=165
EX=31×150+31×165+31×180=165
其实就是求平均体重。
2.学校举行歌唱比赛,假设给一个参赛选手打分,专业评委打分90,老师打分100,学生打分80,专业评委分数权重为0.9,老师权重为0.09,学生权重为0.01,求给该选手的打分期望值。
解:
设随机变量X,其取值分别为打分值:90、100、80,对应的概率为打分权重:0.9、0.09、0.01
所以,X的期望值为:
E
X
=
90
×
0.9
+
100
×
0.09
+
80
×
0.01
=
90.8
EX=90\times 0.9 + 100\times 0.09 + 80\times 0.01=90.8
EX=90×0.9+100×0.09+80×0.01=90.8
该题其实就是加权平均值。
3.甲乙两人X、Y生产产品,次品率分别为:
X | 0 | 1 | 2 | 3 |
---|---|---|---|---|
P | 0.3 | 0.3 | 0.2 | 0.2 |
Y | 0 | 1 | 2 | 3 |
---|---|---|---|---|
P | 0.2 | 0.5 | 0.3 | 0.0 |
求甲乙谁的次品率高。
解:根据期望值来计算:
甲:
E
X
=
0
×
0.3
+
1
×
0.3
+
2
×
0.2
+
3
×
0.2
=
1.3
EX=0\times 0.3 + 1\times 0.3 + 2\times 0.2 + 3\times 0.2=1.3
EX=0×0.3+1×0.3+2×0.2+3×0.2=1.3
乙:
E
Y
=
0
×
0.2
+
1
×
0.5
+
2
×
0.3
+
3
×
0.0
=
1.1
EY=0\times 0.2 + 1\times 0.5 + 2\times 0.3 + 3\times 0.0=1.1
EY=0×0.2+1×0.5+2×0.3+3×0.0=1.1
所以甲的次品率高。
1.2 连续型随机变量的期望
对于连续随机变量 X ,其概率密度函数为 f(x) ,则 X 的数学期望定义为:
E
(
X
)
=
∫
−
∞
+
∞
x
f
(
x
)
d
x
E(X)=∫_{−∞}^{+∞}xf(x) dx
E(X)=∫−∞+∞xf(x) dx
说明:
可以将x理解为随机变量X的取值,f(x)理解为对应的概率。在严格意义上不是正确的,帮助我们理解。
例子
假设概率密度函数
f
(
x
)
=
{
2
x
,
0
<
x
<
1
0
,
其它
f(x)=\begin{cases} 2x,& 0<x<1\\ 0,& 其它 \end{cases}
f(x)={2x,0,0<x<1其它
求期望值。
解:
E
X
=
∫
−
∞
+
∞
x
f
(
x
)
d
x
=
∫
−
∞
0
x
f
(
x
)
d
x
+
∫
0
1
x
f
(
x
)
d
x
+
∫
0
+
∞
x
f
(
x
)
d
x
=
∫
0
1
x
f
(
x
)
d
x
=
∫
0
1
x
2
x
d
x
=
2
3
EX=\int _{-\infty}^{+\infty}xf(x)dx=\int _{-\infty}^0xf(x)dx+\int _{0}^1xf(x)dx+ \int _0^{+\infty}xf(x)dx=\int _{0}^1xf(x)dx=\int _{0}^1x2xdx=\dfrac{2}{3}
EX=∫−∞+∞xf(x)dx=∫−∞0xf(x)dx+∫01xf(x)dx+∫0+∞xf(x)dx=∫01xf(x)dx=∫01x2xdx=32
1.3 随机变量函数的期望
1.3.1 离散型随机变量函数的期望
如果 X 是一个离散随机变量,其可能的取值为 x1,x2,…,xn,对应的概率为 P(X=xi)=pi,那么函数 Y=g(X) 的期望值定义为:
E
Y
=
∑
i
=
1
n
g
(
x
i
)
p
i
EY=∑_{i=1}^ng(x_i)p_i
EY=i=1∑ng(xi)pi
说明:
g(xi):X的取值xi带入函数Y=g(X)得到的新的取值。
计算逻辑:
将X的取值直接带入Y=g(X)函数得出新的取值,然后新值乘以对应的概率,将所有新取值与对应概率乘积相加即可。
例子
假设X的概率分布表:
X | 0 | 1 | 2 |
---|---|---|---|
P | 0.1 | 0.6 | 0.3 |
函数Y=4X+1,求Y的期望。
解:
E
Y
=
(
4
×
0
+
1
)
×
0.1
+
(
4
×
1
+
1
)
×
0.6
+
(
4
×
2
+
1
)
×
0.3
=
0.1
+
3
+
2.7
=
5.8
EY=(4\times 0+1)\times 0.1 + (4\times 1 + 1)\times 0.6 + (4\times 2+1)\times 0.3=0.1 + 3 + 2.7=5.8
EY=(4×0+1)×0.1+(4×1+1)×0.6+(4×2+1)×0.3=0.1+3+2.7=5.8
1.3.2 连续型随机变量函数的期望
如果 X 是一个连续随机变量,其概率密度函数为 f(x),那么函数 Y=g(X)的期望值定义为:
E
Y
=
∫
−
∞
+
∞
g
(
x
)
f
(
x
)
d
x
EY=∫_{−∞}^{+∞}g(x)f(x) dx
EY=∫−∞+∞g(x)f(x) dx
例子
假设密度函数
f
(
x
)
=
{
1
2
,
0
≤
x
≤
2
0
,
其它
f(x)=\begin{cases} \dfrac{1}{2},& 0\leq x \leq 2\\ 0,& 其它 \end{cases}
f(x)=⎩
⎨
⎧21,0,0≤x≤2其它
函数Y=4X+1,求Y的期望。
解:直接代入公式
E
Y
=
∫
−
∞
+
∞
g
(
x
)
f
(
x
)
d
x
=
∫
−
∞
+
∞
(
4
x
+
1
)
f
(
x
)
d
x
=
∫
0
2
1
2
(
4
x
+
1
)
d
x
=
5
EY=∫_{−∞}^{+∞}g(x)f(x) dx=∫_{−∞}^{+∞}(4x+1)f(x) dx=∫_{0}^{2}\dfrac{1}{2}(4x+1) dx=5
EY=∫−∞+∞g(x)f(x) dx=∫−∞+∞(4x+1)f(x) dx=∫0221(4x+1) dx=5
1.3.3 二维离散型随机变量函数的期望
如果 (X,Y) 是离散随机变量,其取值集合为 {(xi,yj)} ,对应的概率为
P
(
X
=
x
i
,
Y
=
y
j
)
=
p
i
j
P(X=x_i,Y=y_j)=p_{ij}
P(X=xi,Y=yj)=pij
,那么函数 Z=g(X,Y) 的数学期望定义为:
E
Z
=
∑
i
∑
j
g
(
x
i
,
y
j
)
p
i
j
EZ=∑_i∑_jg(x_i,y_j)p_{ij}
EZ=i∑j∑g(xi,yj)pij
说明:
g
(
x
i
,
y
j
)
g(x_i,y_j)
g(xi,yj)
表示将X、Y的所有取值按照Z=g(X,Y) 计算出新的取值。
例子
假设X、Y联合概率分布表:
X\y | 0 | 1 | 2 |
---|---|---|---|
1 | 0.1 | 0.1 | 0.2 |
2 | 0.2 | 0.2 | 0.2 |
求
Z
=
X
2
−
Y
Z=X^2-Y
Z=X2−Y
的期望。
解:
将X、Y的所有取值按照Z=g(X,Y) 计算出新的取值,乘以对应的概率,然后相加。
E
Z
=
(
1
1
−
0
)
×
0.1
+
(
1
2
−
1
)
×
0.1
+
(
1
2
−
2
)
×
0.2
+
(
2
2
−
0
)
×
0.2
+
(
2
2
−
1
)
×
0.2
+
(
2
2
−
2
)
×
0.2
=
0.1
+
0
−
0.2
+
0.8
+
0.6
+
0.4
=
1.7
EZ=(1^1-0)\times 0.1 + (1^2-1)\times 0.1+(1^2-2)\times 0.2 + (2^2-0)\times 0.2 + (2^2-1)\times 0.2 + (2^2-2)\times 0.2=0.1+0 -0.2+0.8+0.6+0.4=1.7
EZ=(11−0)×0.1+(12−1)×0.1+(12−2)×0.2+(22−0)×0.2+(22−1)×0.2+(22−2)×0.2=0.1+0−0.2+0.8+0.6+0.4=1.7
1.3.4 二维连续型随机变量函数的期望
如果 (X,Y) 是连续随机变量,其联合概率密度函数为 f(x,y),那么函数 Z=g(X,Y)的数学期望定义为:
E
Z
=
∫
−
∞
+
∞
∫
−
∞
+
∞
g
(
x
,
y
)
f
(
x
,
y
)
d
x
d
y
EZ=∫_{−∞}^{+∞}∫_{−∞}^{+∞}g(x,y)f(x,y) dx dy
EZ=∫−∞+∞∫−∞+∞g(x,y)f(x,y) dx dy
这里,g(X,Y) 是 X和 Y的函数。
例子
假设X、Y的联合密度函数
f
(
x
,
y
)
=
{
x
+
y
,
0
≤
x
≤
1
,
0
≤
y
≤
1
0
,
其它
f(x,y)=\begin{cases} x+y,& 0\leq x\leq 1,0\leq y\leq 1\\ 0,& 其它 \end{cases}
f(x,y)={x+y,0,0≤x≤1,0≤y≤1其它
求E(XY)
解:直接代入公式
E
(
X
Y
)
=
∫
−
∞
+
∞
∫
−
∞
+
∞
g
(
x
,
y
)
f
(
x
,
y
)
d
x
d
y
=
∫
0
1
∫
0
1
x
y
(
x
+
y
)
d
x
d
y
=
∫
0
1
d
x
∫
0
1
x
2
y
+
x
y
2
d
y
=
1
3
E(XY)=∫_{−∞}^{+∞}∫_{−∞}^{+∞}g(x,y)f(x,y) dx dy=∫_{0}^{1}∫_{0}^{1}xy(x+y) dx dy=∫_{0}^{1} dx∫_{0}^{1}x^2y+xy^2 dy=\dfrac{1}{3}
E(XY)=∫−∞+∞∫−∞+∞g(x,y)f(x,y) dx dy=∫01∫01xy(x+y) dx dy=∫01 dx∫01x2y+xy2 dy=31
1.4 数学期望的性质
- 常数的期望等于常数,EC=C
- E(X+C)=EX+C
- E(CX)=C*EX
- E(kX+b)=k*EX+b
- E(X±Y)=EX+EY (任何时候都成立 )
E(∑CiXi) = ∑CiEXi - X、Y独立,E(XY)=EX*EY
例子
假设X、Y独立,X和Y的分布表如下:
X | 9 | 10 | 11 |
---|---|---|---|
P | 0.3 | 0.5 | 0.2 |
Y | 6 | 7 |
---|---|---|
P | 0.4 | 0.6 |
求:
1.
E
(
X
+
Y
)
;
2.
E
(
X
Y
)
;
3.
E
(
Y
2
)
1.E(X+Y);2.E(XY);3.E(Y^2)
1.E(X+Y);2.E(XY);3.E(Y2)
解:
先计算EX和EY:
E
X
=
9
×
0.3
+
10
×
0.5
+
11
×
0.2
=
9.9
E
Y
=
6
×
0.4
+
7
×
0.6
=
6.6
EX=9\times 0.3 + 10\times 0.5 + 11\times 0.2=9.9\\ EY=6\times 0.4 + 7\times 0.6=6.6
EX=9×0.3+10×0.5+11×0.2=9.9EY=6×0.4+7×0.6=6.6
1.使用性质5计算
E
(
X
+
Y
)
=
E
X
+
E
Y
=
9.9
+
6.6
=
16.5
E(X+Y)=EX+EY=9.9+6.6=16.5
E(X+Y)=EX+EY=9.9+6.6=16.5
2.使用性质6计算
E
(
X
Y
)
=
E
X
E
Y
=
9.9
×
6.6
=
65.34
E(XY)=EXEY=9.9\times 6.6=65.34
E(XY)=EXEY=9.9×6.6=65.34
3.两个事件Y不能确定是独立的,所以不能使用性质计算,使用定义来做
E
(
Y
2
)
=
(
6
×
6
)
×
0.4
+
(
7
×
7
)
×
0.6
=
36
×
0.4
+
49
×
0.6
=
43.8
E(Y^2)=(6\times 6)\times 0.4+(7\times 7)\times 0.6=36\times 0.4 + 49\times 0.6=43.8
E(Y2)=(6×6)×0.4+(7×7)×0.6=36×0.4+49×0.6=43.8
2.方差
方差是统计学中一个重要的概念,用于衡量随机变量或一组数据的离散程度。它反映了数据点与其平均值之间的偏离程度。方差越大,数据点越分散;方差越小,数据点越集中。
对于一个随机变量 X,其方差 Var(X)或DX定义为:
D
X
=
E
[
(
X
−
E
X
)
2
]
=
E
(
X
2
)
−
(
E
X
)
2
DX=E[(X−EX)^2]=E(X^2)-(EX)^2
DX=E[(X−EX)2]=E(X2)−(EX)2
D X \sqrt {DX} DX
叫做标准差。
2.1 离散型随机变量的方差
对于离散型随机变量 X,其方差可以表示为:
D
X
=
∑
i
(
x
i
−
E
X
)
2
⋅
P
(
X
=
x
i
)
DX=∑_i(x_i−EX)^2⋅P(X=x_i)
DX=i∑(xi−EX)2⋅P(X=xi)
例子
假设
X | -2 | 0 | 2 |
---|---|---|---|
P | 0.4 | 0.3 | 0.3 |
求方差DX。
解:
先求EX:
E
X
=
(
−
2
)
×
0.4
+
0
×
0.3
+
2
×
0.3
=
−
0.2
EX=(-2)\times 0.4 + 0 \times 0.3 + 2\times 0.3=-0.2
EX=(−2)×0.4+0×0.3+2×0.3=−0.2
再求EX^2:
E
X
2
=
(
−
2
)
2
×
0.4
+
0
2
×
0.3
+
2
2
×
0.3
=
0.16
+
0.12
=
2.8
EX^2=(-2)^2\times 0.4 + 0^2 \times 0.3 + 2^2\times 0.3=0.16+0.12=2.8
EX2=(−2)2×0.4+02×0.3+22×0.3=0.16+0.12=2.8
求方差:
D
X
=
E
X
2
−
(
E
X
)
2
=
2.8
−
0.04
=
2.76
DX=EX^2-(EX)^2=2.8-0.04=2.76
DX=EX2−(EX)2=2.8−0.04=2.76
2.2 连续型随机变量的方差
对于连续型随机变量 XX,其方差可以表示为:
D
X
=
∫
−
∞
∞
(
x
−
E
X
)
2
⋅
f
(
x
)
d
x
DX=∫_{−∞}^∞(x−EX)^2⋅f(x) dx
DX=∫−∞∞(x−EX)2⋅f(x) dx
例子
假设密度函数:
f
(
x
)
=
{
2
x
,
0
<
x
<
1
0
,
其它
f(x)=\begin{cases} 2x,& 0<x<1\\ 0,& 其它 \end{cases}
f(x)={2x,0,0<x<1其它
求方差DX。
解:
求EX:
E
X
=
∫
−
∞
+
∞
x
f
(
x
)
d
x
=
∫
0
1
x
⋅
2
x
d
x
=
2
3
EX=\int _{-\infty}^{+\infty}xf(x)dx=\int _0^1x⋅2xdx=\dfrac{2}{3}
EX=∫−∞+∞xf(x)dx=∫01x⋅2xdx=32
求EX^2:
E
X
2
=
∫
−
∞
+
∞
x
2
f
(
x
)
d
x
=
∫
0
1
x
2
⋅
2
x
d
x
=
1
2
EX^2=\int _{-\infty}^{+\infty}x^2f(x)dx=\int _0^1x^2⋅2xdx=\dfrac{1}{2}
EX2=∫−∞+∞x2f(x)dx=∫01x2⋅2xdx=21
求DX:
D
X
=
E
X
2
−
(
E
X
)
2
=
1
2
−
(
2
3
)
2
=
1
18
DX=EX^2-(EX)^2=\dfrac{1}{2}-(\dfrac{2}{3})^2=\dfrac{1}{18}
DX=EX2−(EX)2=21−(32)2=181
2.3 方差的性质
-
常数的方差:DC = 0
-
D(X+C) = DX
-
D ( C X ) = C 2 D X D(CX) = C^2DX D(CX)=C2DX
-
D ( k X + b ) = k 2 D X D(kX+b) = k^2DX D(kX+b)=k2DX
-
X、Y独立,D(X±Y) = DX+DY
-
X、Y不独立,D(X±Y) = DX+DY±2Cov(X,Y) Cov(X,Y)是协方差,后边会讲
这里需要注意方差的性质与期望性质的不同。
3.常见离散型的期望与方差
3.1 0-1分布
X | 0 | 1 |
---|---|---|
p | 1-p | p |
E X = p , D X = E X 2 − ( E X ) 2 = p − p 2 = p ( 1 − p ) = p q EX=p,\\DX = EX^2-(EX)^2=p-p^2=p(1-p)=pq EX=p,DX=EX2−(EX)2=p−p2=p(1−p)=pq
其中q=1-p
3.2 二项分布
P ( x = k ) = C k n p k q ( n − k ) , k = 0 , 1 , … … n P(x=k) = C_k^np^kq^(n-k),k=0,1,……n P(x=k)=Cknpkq(n−k),k=0,1,……n
期望与方差:
E
(
X
)
=
n
⋅
p
D
X
=
n
⋅
p
⋅
(
1
−
p
)
=
n
p
q
E(X)=n⋅p\\ DX=n⋅p⋅(1−p)=npq
E(X)=n⋅pDX=n⋅p⋅(1−p)=npq
3.3 几何分布
P ( x = k ) = ( 1 − p ) k − 1 p , k = 1 , 2 , … … P(x=k) = (1-p)^{k-1}p,k=1,2,…… P(x=k)=(1−p)k−1p,k=1,2,……
E X = 1 p D X = ( 1 − p ) p 2 EX = \dfrac{1}{p}\\ DX = \dfrac{(1-p)}{p^2} EX=p1DX=p2(1−p)
3.4 泊松分布
E X = λ D X = λ EX = λ\\ DX=λ EX=λDX=λ
4.常见连续型的期望与方差
4.1 均匀分布
E X = ∫ a b x ( 1 b − a ) d x = ( a + b ) / 2 D X = ( b − a ) 2 / 12 EX = ∫_a^bx(\dfrac{1}{b-a})dx = (a+b)/2\\ DX = (b-a)^2/12 EX=∫abx(b−a1)dx=(a+b)/2DX=(b−a)2/12
4.2 指数分布
E X = 1 λ D X = 1 λ 2 EX = \dfrac{1}{λ}\\ DX = \dfrac{1}{λ^2} EX=λ1DX=λ21
4.3 正态分布
X ∼ N ( u , σ 2 ) X \sim N(u,σ2) X∼N(u,σ2)
期望与方差:
E
X
=
u
D
X
=
σ
2
EX = u\\ DX = σ2
EX=uDX=σ2
5.协方差
协方差是衡量两个随机变量之间线性关系强度的统计量。如果两个变量的协方差为正,它们之间存在正相关关系;如果协方差为负,它们之间存在负相关关系;如果协方差为零,它们之间没有线性关系。
5.1 定义
对于两个随机变量 X 和 Y,它们的协方差定义为:
C
o
v
(
X
,
Y
)
=
E
[
(
X
−
E
X
)
(
Y
−
E
Y
)
]
Cov(X,Y)=E[(X−EX)(Y−EY)]
Cov(X,Y)=E[(X−EX)(Y−EY)]
其中 EX 和 EY 分别是 X 和 Y 的期望值。
协方差的计算公式可以表示为:
C
o
v
(
X
,
Y
)
=
E
(
X
Y
)
−
E
X
E
Y
Cov(X,Y)=E(XY)−EXEY
Cov(X,Y)=E(XY)−EXEY
5.2 性质
C o v ( X , Y ) = C o v ( Y , X ) C o v ( a X , b Y ) = a b C o v ( X , Y ) C o v ( X 1 + X 2 , Y ) = C o v ( X 1 , Y ) + C o v ( X 2 , Y ) C o v ( C , X ) = 0 X 、 Y 独立, C o v ( X , Y ) = 0 Cov(X,Y) = Cov(Y,X)\\ Cov(aX,bY) = abCov(X,Y)\\ Cov(X_1+X_2,Y) = Cov(X_1,Y)+Cov(X_2,Y)\\ Cov(C,X) = 0\\ X、Y独立,Cov(X,Y) = 0 Cov(X,Y)=Cov(Y,X)Cov(aX,bY)=abCov(X,Y)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)Cov(C,X)=0X、Y独立,Cov(X,Y)=0
5.3 相关系数
协方差的一个限制是它的值依赖于变量的尺度。为了克服这个限制,通常使用相关系数(Pearson相关系数)来衡量两个变量之间的线性关系,其定义为:
ρ
=
C
o
v
(
X
,
Y
)
D
X
D
Y
ρ=\dfrac{Cov(X,Y)}{\sqrt {DX}\sqrt {DY}}
ρ=DXDYCov(X,Y)
相关系数的值在 -1 和 1 之间,其中 -1 表示完全负相关,1 表示完全正相关,0 表示没有线性关系。
解释
- 正相关:如果相关系数为正,表明当一个变量的值增加时,另一个变量的值也倾向于增加。
- 负相关:如果相关系数为负,表明当一个变量的值增加时,另一个变量的值倾向于减少。
- 无相关:如果相关系数为零,表明两个变量之间没有线性关系。
6.原点矩和中心距
中心距和原点矩分别描述了随机变量在其期望值(中心)和原点(零点)周围的分布情况。
6.1 原点矩
原点矩是随机变量 X与原点0的差 的幂次期望值。对于随机变量 X,其 k 阶原点矩定义为:
μ
k
′
=
E
X
k
μ_k^′=EX^k
μk′=EXk
其中 E 表示期望值。可以理解为:
μ
k
′
=
E
(
X
−
0
)
k
μ_k^′=E(X-0)^k
μk′=E(X−0)k
常见原点矩
-
一阶原点矩:
μ 1 ′ = E X μ_1^′=EX μ1′=EX这实际上是随机变量 X 的期望值(平均值)。
-
二阶原点矩:
μ 2 ′ = E X 2 μ_2^′=EX^2 μ2′=EX2这实际上是随机变量 X 的平方的期望值。
6.2 中心距
中心距
中心距是随机变量 X 与其期望值 EX的差的幂次期望值。对于随机变量 X,其 k 阶中心距定义为:
μ
k
=
E
[
(
X
−
E
X
)
k
]
μ_k=E[(X−EX)^k]
μk=E[(X−EX)k]
其中 E 表示期望值。
常见中心距
-
一阶中心距:
μ 1 = E [ ( X − E X ) ] = 0 μ_1=E[(X−EX)]=0 μ1=E[(X−EX)]=0
这实际上是零,因为
E [ X − E X ] = E X − E X = 0 E[X−EX]=EX−EX=0 E[X−EX]=EX−EX=0 -
二阶中心距:
μ 2 = E [ ( X − E X ) 2 ] μ_2=E[(X−EX)^2] μ2=E[(X−EX)2]这实际上是随机变量 X 的方差 DX。