【概率论】4-2:期望的性质(Properties of Expectation)


Abstract: 本文介绍关于期望的性质,主要是计算性质,所以本文会有非常多公式定理,例子可能较少
Keywords: Properties of Expectation



期望的基本定理 Basic Theorems

Linear Function:.If Y=aX+b,where a and b are finite constants,then
E ( Y ) = a E ( X ) + b E(Y)=aE(X)+b E(Y)=aE(X)+b

线性关系,最简单的变化, a , b a,b a,b 是有限的常数,那么新的随机变量的期望和原始变量的关系满足上式,其实用上一篇的关于随机变量函数的方法就能证明这个问题,我们来计算一下:
E ( Y ) = E ( a X + b ) = ∫ ∞ ∞ ( a x + b ) f ( x ) d x = a ∫ − ∞ ∞ x f ( x ) d x + b ∫ − ∞ ∞ f ( x ) d x = a E ( x ) + b E(Y)=E(aX+b)=\int^{\infty}_{\infty}(ax+b)f(x)dx\\ =a\int^{\infty}_{-\infty}xf(x)dx+b\int^{\infty}_{-\infty}f(x)dx\\ =aE(x)+b E(Y)=E(aX+b)=(ax+b)f(x)dx=axf(x)dx+bf(x)dx=aE(x)+b


Corollary If X = c X=c X=c with probability 1 ,then E ( X ) = c E(X)=c E(X)=c

E ( X ) = ∫ − ∞ ∞ c f ( x ) d x = c ∫ − ∞ ∞ f ( x ) d x = c E(X)=\int^{\infty}_{-\infty}cf(x)dx\\ =c\int^{\infty}_{-\infty}f(x)dx=c E(X)=cf(x)dx=cf(x)dx=c

Theorem If there exists a constant such that P r ( X ≥ a ) = 1 Pr(X\geq a)=1 Pr(Xa)=1, then E ( X ) ≥ a E(X)\geq a E(X)a. If there exists a constant b b b such that P r ( X ≤ b ) = 1 Pr(X\leq b)=1 Pr(Xb)=1,then E ( X ) ≤ b E(X)\leq b E(X)b

这个定理说明当存在一个常数 a a a 满足 P r ( X ≥ a ) = 1 Pr(X\geq a)=1 Pr(Xa)=1 那么 E ( X ) ≥ a E(X)\geq a E(X)a 另一部分是反过来的,所以我们只要证明了一半,另一半可以用同样的方法得到结论。
E ( X ) = ∫ − ∞ ∞ x f ( x ) d x = ∫ a ∞ x f ( x ) d x ≥ ∫ a ∞ a f ( x ) d x = a P r ( X ≥ a ) = a E(X)=\int^{\infty}_{-\infty}xf(x)dx=\int^{\infty}_{a}xf(x)dx\\ \geq \int^{\infty}_{a}af(x)dx=aPr(X\geq a)=a E(X)=xf(x)dx=axf(x)dxaaf(x)dx=aPr(Xa)=a
其中这一步 ∫ a ∞ x f ( x ) d x ≥ ∫ a ∞ a f ( x ) d x \int^{\infty}_{a}xf(x)dx\geq \int^{\infty}_{a}af(x)dx axf(x)dxaaf(x)dx 用到的条件是 x ≥ a x\geq a xa ∫ a ∞ a f ( x ) d x = a P r ( X ≥ a ) \int^{\infty}_{a}af(x)dx=aPr(X\geq a) aaf(x)dx=aPr(Xa) 用到的是积分的线性性质,和概率的相关定义。

Theorem Suppose that E ( x ) = a E(x)=a E(x)=a and that either P r ( X ≥ a ) = 1 Pr(X\geq a)=1 Pr(Xa)=1 or P r ( X ≤ a ) = 1 Pr(X\leq a)=1 Pr(Xa)=1 .Then P r ( X = a ) = 1 Pr(X=a)=1 Pr(X=a)=1

定理解释当知道一个随机变量的期望值是 a a a 时,那么如果知道 P r ( X ≥ a ) = 1 Pr(X\geq a)=1 Pr(Xa)=1 或者 P r ( X ≤ a ) = 1 Pr(X\leq a)=1 Pr(Xa)=1 必然有 P r ( X = a ) = 1 Pr(X=a)=1 Pr(X=a)=1
证明当X时离散情况下 P r ( X ≥ a ) = 1 Pr(X\geq a)=1 Pr(Xa)=1 其他情况类似,假设 x 1 , x 2 , … x_1,x_2,\dots x1,x2, 包含所有 x > a x>a x>a 那么 P r ( X = x ) > 0 Pr(X=x)>0 Pr(X=x)>0 p 0 = P r ( X = a ) p_0=Pr(X=a) p0=Pr(X=a) 那么
E ( X ) = p 0 a + ∑ j = 1 ∞ x j P r ( X = x j ) E(X)=p_0a+\sum^{\infty}_{j=1}x_jPr(X=x_j) E(X)=p0a+j=1xjPr(X=xj)

每个 x j x_j xj 都大于 a a a 其和不能变大 因为
E ( X ) ≥ p 0 a + ∑ j = 1 ∞ a P r ( X = x j ) = a E(X)\geq p_0a + \sum^{\infty}_{j=1}aPr(X=x_j)=a E(X)p0a+j=1aPr(X=xj)=a

Theorem If X 1 , … , X n X_1,\dots,X_n X1,,Xn are n n n random variables such that each expectation E ( X i ) E(X_i) E(Xi) is finite ( i = 0 , … , n ) (i=0,\dots,n) (i=0,,n) ,then
E ( X 1 + ⋯ + X n ) = E ( X 1 ) + ⋯ + E ( X n ) E(X_1+\dots+X_n)=E(X_1)+\dots+E(X_n) E(X1++Xn)=E(X1)++E(Xn)

E ( X 1 + X 2 ) = ∫ − ∞ ∞ ∫ − ∞ ∞ ( x 1 + x 2 ) f ( x 1 , x 2 ) d x 1 d x 2 = ∫ − ∞ ∞ ∫ − ∞ ∞ x 1 f ( x 1 , x 2 ) d x 1 d x 2 + ∫ − ∞ ∞ ∫ − ∞ ∞ x 2 f ( x 1 , x 2 ) d x 1 d x 2 = ∫ − ∞ ∞ x 1 f 1 ( x 1 ) d x 1 + ∫ − ∞ ∞ x 2 f 2 ( x 2 ) d x 2 = E ( X 1 ) + E ( X 2 ) E(X_1+X_2)=\int^{\infty}_{-\infty}\int^{\infty}_{-\infty}(x_1+x_2)f(x_1,x_2)dx_1dx_2\\ =\int^{\infty}_{-\infty}\int^{\infty}_{-\infty}x_1f(x_1,x_2)dx_1dx_2+\int^{\infty}_{-\infty}\int^{\infty}_{-\infty}x_2f(x_1,x_2)dx_1dx_2\\ =\int^{\infty}_{-\infty}x_1f_1(x_1)dx_1+\int^{\infty}_{-\infty}x_2f_2(x_2)dx_2\\ =E(X_1)+E(X_2) E(X1+X2)=(x1+x2)f(x1,x2)dx1dx2=x1f(x1,x2)dx1dx2+x2f(x1,x2)dx1dx2=x1f1(x1)dx1+x2f2(x2)dx2=E(X1)+E(X2)

证明过程最关键一步是 ∫ − ∞ ∞ ∫ − ∞ ∞ x 1 f ( x 1 , x 2 ) d x 1 d x 2 = ∫ − ∞ ∞ x 1 f 1 ( x 1 ) d x 1 \int^{\infty}_{-\infty}\int^{\infty}_{-\infty}x_1f(x_1,x_2)dx_1dx_2=\int^{\infty}_{-\infty}x_1f_1(x_1)dx_1 x1f(x1,x2)dx1dx2=x1f1(x1)dx1 的过程,首先调换积分变量的次序 ∫ − ∞ ∞ ∫ − ∞ ∞ x 1 f ( x 1 , x 2 ) d x 2 d x 1 \int^{\infty}_{-\infty}\int^{\infty}_{-\infty}x_1f(x_1,x_2)dx_2dx_1 x1f(x1,x2)dx2dx1 这样,内层积分中 x 1 x_1 x1 是常量,那么就可以提出来 ∫ − ∞ ∞ x 1 [ ∫ − ∞ ∞ f ( x 1 , x 2 ) d x 2 ] d x 1 \int^{\infty}_{-\infty}x_1[\int^{\infty}_{-\infty}f(x_1,x_2)dx_2]dx_1 x1[f(x1,x2)dx2]dx1 这样中括号里面的部分就是 x 1 x_1 x1 的边缘变量了,同理可得 x 2 x_2 x2 的情况,故得到最后结论。



Corollary Assume that E ( x i ) E(x_i) E(xi) is finite for i = 1 , … , n i=1,\dots,n i=1,,n For all constants a 1 , … , a n a_1,\dots,a_n a1,,an and b b b
E ( a 1 X 1 + ⋯ + a n X n + b ) = a 1 E ( X 1 ) + … a n E ( X n ) + b E(a_1X_1+\dots + a_nX_n+b)=a_1E(X_1)+\dots a_nE(X_n)+b E(a1X1++anXn+b)=a1E(X1)+anE(Xn)+b


注意:上面线性的函数g可以有 E [ g ( x ) ] ≠ g ( E [ x ] ) E[g(x)]\neq g(E[x]) E[g(x)]=g(E[x]) 的关系,但其他函数没有这种关系!Jensen’s inequality 会给出其他函数之间两者的关系

Definition Convex Functions A function g of a vector argument is convex if ,for every α ∈ ( 0 , 1 ) \alpha\in (0,1) α(0,1) and every x and y,
g [ α x + ( 1 − α ) y ] ≥ α g ( x ) + ( 1 − α ) g ( y ) g[\alpha x+(1-\alpha)y] \geq \alpha g(x)+(1-\alpha)g(y) g[αx+(1α)y]αg(x)+(1α)g(y)


Theorem Jensen’s Inequality. Let g be a convex function,and let X X X be a random vector with finite mean.Then E [ g ( X ) ] ≥ g ( E [ X ] ) E[g(X)]\geq g(E[X]) E[g(X)]g(E[X])

詹森不等式,说明了函数的期望和期望的函数之间的一般大小关系,等号当且仅当 g g g 是线性函数时成立,证明过程书上没写,等我思考出完整的证明后再来补充一下。

独立随机变量之积的期望关系 Expectation of a Product of Independent Random Variables

If X 1 , … , X n X_1,\dots,X_n X1,,Xn are n n n independent random variables such that each expectation E ( X i ) E(X_i) E(Xi) is finite ( i = 1 , … , n ) (i=1,\dots,n) (i=1,,n) then
E ( Π i = 1 n X i ) = Π i = 1 n E ( X i ) E(\Pi^{n}_{i=1}X_i)=\Pi^{n}_{i=1}E(X_i) E(Πi=1nXi)=Πi=1nE(Xi)

证明,为了方便我们假设这组连续随机变量的联合分布p.d.f. 是 f f f 并且 f i f_i fi 是其中 变量 i i i 的边缘分布,因为他们之间彼此独立,所以
f ( x 1 , … , x i ) = Π i = 1 n f i ( x i ) f(x_1,\dots,x_i)=\Pi^{n}_{i=1}f_i(x_i) f(x1,,xi)=Πi=1nfi(xi)
E ( Π i = 1 n X i ) = ∫ − ∞ ∞  ⁣ ⋯ ∫ − ∞ ∞ ( Π i = 1 n x i ) f ( x 1 , … , x n ) d x 1 , … , x n = ∫ − ∞ ∞  ⁣ ⋯ ∫ − ∞ ∞ Π i = 1 n [ x i f i ( x i ) ] d x 1 , … , x n = Π i = 1 n ∫ − ∞ ∞ x i f i ( x i ) d x i E(\Pi^{n}_{i=1}X_i)\\ =\int^{\infty}_{-\infty}\dots \int^{\infty}_{-\infty}(\Pi^{n}_{i=1}x_i)f(x_1,\dots,x_n)dx_1,\dots,x_n\\ =\int^{\infty}_{-\infty}\dots \int^{\infty}_{-\infty}\Pi^{n}_{i=1}[x_if_i(x_i)]dx_1,\dots,x_n\\ =\Pi^{n}_{i=1} \int^{\infty}_{-\infty}x_if_i(x_i)dx_i E(Πi=1nXi)=(Πi=1nxi)f(x1,,xn)dx1,,xn=Πi=1n[xifi(xi)]dx1,,xn=Πi=1nxifi(xi)dxi

最后一步的拆分大家可能会感到疑惑不解,把积分内层拆开,那么每个除了当前要积分的 x i x_i xi 以外,其他变量都是已知的就可以挪到本层积分的外面,然后本层积分的结果也必然是是个数字,所以一层一层的拆开就是最后的式子,如果实在看不懂,试试两个独立现需随机变量的计算请款个就知道了。



