随机方面的知识非常欠缺,最近看看资料学习一下。
前情提要:什么是概率空间上的随机变量?随机变量是样本空间 ( Ω ) (\Omega) (Ω)上的一个(可测)函数,例如 ξ : Ω → R \xi:\Omega\to \mathbb{R} ξ:Ω→R, { ξ ≤ x } : = { ω ∈ Ω : ξ ( ω ) ≤ x } ∈ F \{\xi\le x\}:=\{\omega\in\Omega:\xi(\omega)\le x\}\in\mathscr{F} { ξ≤x}:={ ω∈Ω:ξ(ω)≤x}∈F。
条件数学期望
定义1
定义1: X , Y 1 , … , Y n X,Y_1,\dots,Y_n X,Y1,…,Yn为概率空间 ( Ω , F , P ) (\Omega,\mathscr{F},P) (Ω,F,P)上的随机变量且满足 E [ X 2 ] < ∞ \mathbb{E}[X^2]<\infty E[X2]<∞,称由 Y 1 , … , Y n Y_1,\dots,Y_n Y1,…,Yn决定的随机变量 f ( Y 1 , … , Y n ) f(Y_1,\dots,Y_n) f(Y1,…,Yn)为 X X X关于 Y 1 , … , Y n Y_1,\dots,Y_n Y1,…,Yn的条件数学期望,若 f ( Y 1 , … , Y n ) f(Y_1,\dots,Y_n) f(Y1,…,Yn)满足
- E [ f 2 ( Y 1 , … , Y n ) ] < ∞ \mathbb{E}[f^2(Y_1,\dots,Y_n)]<\infty E[f2(Y1,…,Yn)]<∞;
- 任意的 g ( Y 1 , … , Y n ) ∈ L 2 ( Ω , σ ( Y 1 , Y 2 , … , Y n ) , P ) g(Y_1,\dots,Y_n)\in L^2(\Omega,\sigma(Y_1,Y_2,\dots,Y_n),P) g(Y1,…,Yn)∈L2(Ω,σ(Y1,Y2,…,Yn),P)(也就是说 g g g满足 E [ g 2 ( Y 1 , … , Y n ) ] < ∞ \mathbb{E}[g^2(Y_1,\dots,Y_n)]<\infty E[g2(Y1,…,Yn)]<∞),下式成立 E [ X g ( Y 1 , … , Y n ) ] = E [ f ( Y 1 , … , Y n ) g ( Y 1 , … , Y n ) ] . \mathbb{E}[Xg(Y_1,\dots,Y_n)]=\mathbb{E}[f(Y_1,\dots,Y_n)g(Y_1,\dots,Y_n)]. E[Xg(Y1,…,Yn)]=E[f(Y1,…,Yn)g(Y1,…,Yn)].把 f ( Y 1 , … , Y n ) f(Y_1,\dots,Y_n) f(Y1,…,Yn)记为 E [ X ∣ Y 1 , … , Y n ] \mathbb{E}[X|Y_1,\dots,Y_n] E[X∣Y1,…,Yn]。
注意!!! 这个条件数学期望不是期望值,而是一个随机变量!!!它是在 Y 1 , … , Y n Y_1,\dots,Y_n Y1,…,Yn成立的条件下 X X X最可能的值。
g ( Y 1 , … , Y n ) g(Y_1,\dots,Y_n) g(Y1,…,Yn)可以看做是一个复合函数 g ∘ ( Y 1 , … , Y n ) ( ω ) g\circ(Y_1,\dots,Y_n)(\omega) g∘(Y1,…,Yn)(ω)。
在求解条件数学期望的时候要多多应用 E [ X g ( Y 1 , … , Y n ) ] = E [ f ( Y 1 , … , Y n ) g ( Y 1 , … , Y n ) ] , ∀ g ∈ L 2 ( Ω , σ ( Y 1 , … , Y n ) , P ) \mathbb{E}[Xg(Y_1,\dots,Y_n)]=\mathbb{E}[f(Y_1,\dots,Y_n)g(Y_1,\dots,Y_n)], \forall g\in L^2(\Omega,\sigma(Y_1,\dots,Y_n),P) E[Xg(Y1,…,Yn)]=E[f(Y1,…,Yn)g(Y1,…,Yn)],∀g∈L2(Ω,σ(Y1,…,Yn),P)。
例1:设 ( X , Y ) (X,Y) (X,Y)服从密度函数为 p ( x , y ) p(x,y) p(x,y)的连续型分布函数,且假定 p ( x , y ) > 0 p(x,y)>0 p(x,y)>0, ( x , y ) ∈ R 2 (x,y)\in \mathbb{R}^2 (x,y)∈R2, E [ X 2 ] < ∞ \mathbb{E}[X^2]<\infty E[X2]<∞,求 E [ X ∣ Y ] \mathbb{E}[X|Y] E[X∣Y]。
解:我们需要求一个Borel可测函数 f f f,使得 E [ X ∣ Y ] = f ( Y ) \mathbb{E}[X|Y]=f(Y) E[X∣Y]=f(Y),满足 ∀ g ∈ L 2 ( Ω , σ ( Y ) , P ) \forall g\in L^2(\Omega,\sigma(Y),P) ∀g∈L2(Ω,σ(Y),P), E [ f ( Y ) g ( Y ) ] = E [ X g ( Y ) ] . \mathbb{E}[f(Y)g(Y)]=\mathbb{E}[Xg(Y)]. E[f(Y)g(Y)]=E[Xg(Y)]. Y Y Y的边际密度为 p Y ( y ) = ∫ R p ( x , y ) d x p_Y(y)=\int_{\mathbb{R}}p(x,y)\mathrm{d}x pY(y)=∫Rp(x,y)dx,且假定对任意的 y , p Y ( y ) > 0 y,p_Y(y)>0 y,pY(y)>0, E [ f ( Y ) g ( Y ) ] = ∫ R g ( y ) f ( y ) p Y ( y ) d y E [ X g ( Y ) ] = ∫ _ R i n t R x g ( y ) p ( x , y ) d x d y = ∫ R g ( y ) ( ∫ R x p ( x , y ) d x ) d y \begin{aligned} \mathbb{E}[f(Y)g(Y)]&=\int_{\mathbb{R}}g(y)f(y)p_Y(y)\mathrm{d}y\\ \mathbb{E}[Xg(Y)]&=\int\_{\mathbb{R}}int_{\mathbb{R}}xg(y)p(x,y)\mathrm{d}x\mathrm{d}y\\ &=\int_{\mathbb{R}}g(y)(\int_{\mathbb{R}}xp(x,y)\mathrm{d}x)\mathrm{d}y \end{aligned} E[f(Y)g(Y)]E[Xg(Y)]=∫Rg(y)f(y)pY(y)dy=∫_RintRxg(y)p(x,y)dxdy=∫Rg(y)(∫Rxp(x,y)dx)dy 由 g ( y ) g(y) g(y)的任意性,由实变知识可知【我感觉这里其实是泛函的知识,L^2是自反的,利用了“对于线性赋范空间的点 x , y x,y x,y,若对任意有界线性泛函 f f f都有 f ( x ) = f ( y ) f(x)=f(y) f(x)=f(y),则 x = y x=y x=y”【这个用Hahn-Banach延拓来证】】 f ( y ) = ∫ R x p ( x , y ) d x p Y ( y ) . f(y)=\frac{\int_{\mathbb{R}}xp(x,y)\mathrm{d}x}{p_Y(y)}. f(y)=pY(y)∫Rxp(x,y)dx. □ \Box □.
定义2+性质
定义2
定义2:设 X , Y 1 , … , Y n X,Y_1,\dots,Y_n X,Y1,…,Yn为概率空间 ( Ω , F , P ) (\Omega,\mathscr{F},P) (Ω,F,P)上的随机变量,满足 E [ ∣ X ∣ ] < ∞ \mathbb{E}[|X|]<\infty E[∣X∣]<∞, f f f为 R n → R \mathbb{R}^n\to\mathbb{R} Rn→R的Borel函数,称 f ( Y 1 , … , Y n ) f(Y_1,\dots,Y_n) f(Y1,…,Yn)为 X X X关于 ( Y 1 , … , Y n ) (Y_1,\dots,Y_n) (Y1,…,Yn)的条件数学期望,若
- E ∣ f ( Y 1 , … , Y n ) ∣ < ∞ \mathbb{E}|f(Y_1,\dots,Y_n)|<\infty E∣f(Y1,…,Yn)∣<∞;
- 对于任意的 n n n维有界Borel函数 g g g,下式成立 E [ X g ( Y 1 , … , Y n ) ] = E [ f ( Y 1 , … , Y n ) g ( Y 1 , … , Y n ) ] . \mathbb{E}[Xg(Y_1,\dots,Y_n)]=\mathbb{E}[f(Y_1,\dots,Y_n)g(Y_1,\dots,Y_n)]. E[Xg(Y1,…,Yn)]=E[f(Y1,…,Yn)g(Y1,…,Yn)].把 f ( Y 1 , … , Y n ) f(Y_1,\dots,Y_n) f(Y1,…,Yn)记为 E [ X ∣ Y 1 , … , Y n ] E[X|Y_1,\dots,Y_n] E