本专栏主要作个人复习自测,有相关知识预备的同学也可作复习用。不保证无相应基础的人士能看明白。
万一考试考到了,或者对你的学习有较大帮助,一键三连不过分吧(斜眼笑)
期望:例题
- Polya坛子:初始 b b b黑 r r r红,每次摸到球之后加入 c c c个同色球,定义随机变量 Y n Y_n Yn表示第 n n n轮后黑球占比,证明 E Y n EY_n EYn和 n n n无关。为什么要考虑条件期望?
- 如果每次摸到黑球之后只以 p p p概率加黑球,否则加红球,则0.发生什么变化?
- 如果1.中机制保留,并且摸到红球时也只以 p p p概率加红球,否则加黑球,那怎么办?
- U i ∼ U ( 0 , 1 ) U_i\sim U(0,1) Ui∼U(0,1)独立同分布,为了求 X a = i n f { n ∣ U 1 + ⋯ + U n ≥ a } X_a=inf\{n|U_1+\cdots+U_n\ge a\} Xa=inf{n∣U1+⋯+Un≥a},把 X a X_a Xa改写为 1 { U 1 ≥ a } + 1_{\{U_1\ge a\}}+ 1{U1≥a}+(),再利用重期望公式,让上式中()取一系列确定值。
答案
- 条件期望好算, E ( Y n + 1 ∣ Y n = y ) = y E(Y_{n+1}|Y_n=y)=y E(Yn+1∣Yn=y)=y
- E ( Y n + 1 ∣ Y n = y ) = ( b + r + n c ) y + y ( 1 − p ) c b + r + n c + c E(Y_{n+1}|Y_n=y)=\frac{(b+r+nc)y+y(1-p)c}{b+r+nc+c} E(Yn+1∣Yn=y)=b+r+nc+c(b+r+nc)y+y(1−p)c,类似于“指数衰减”(放缩一下)
- 数列题
- 1 { U 1 < a } ( 1 + X ^ a − U 1 ) 1_{\{U_1< a\}}(1+ \hat X_{a-U_1}) 1{U1<a}(1+X^a−U1)(注:这里 X ^ a \hat X_a X^a和 X a X_a Xa分布相同), U 1 U_1 U1
方差
- 怎么用原点矩表示方差?
- 参考0.,则“方差发散”一词表示矩满足什么?(提示:此时期望不能发散)方差为0表示随机变量是什么?
- 叙述线性变换对方差的影响、标准化,并针对 X ∼ B ( n , p ) X\sim B(n,p) X∼B(n,p)举例。
- 示性函数之和的方差怎么求?对于两两独立的特殊情况呢?
- 考察形如 E X ( X − 1 ) EX(X-1) EX(X−1)求泊松分布的 E X 2 EX^2 EX2,直接说出 P ( λ ) P(\lambda) P(λ)的方差。根据定义求 U ( a , b ) U(a,b) U(a,b)的方差。
- 切比雪夫不等式的本质是放缩成柱形区域,柱的底面积和高度分别是什么?
- 用方差、协方差表示和的方差,阐述对无关的随机变量由此有什么结论。
答案
- E X 2 − ( E X ) 2 EX^2-(EX)^2 EX2−(EX)2
- 二阶原点矩 E X 2 EX^2 EX2发散,但 E ∣ X ∣ < ∞ E|X|<\infty E∣X∣<∞. X X X以概率1等于 E X EX EX(注:首先 E X EX EX存在显然,然后考察可数个零概率事件即可)
- v a r ( a X + b ) = a 2 v a r ( X ) var(aX+b)=a^2 var(X) var(aX+b)=a2var(X), X ∗ = ( X − μ ) / σ X^*=(X-\mu)/\sigma X∗=(X−μ)/σ, X ∗ = X − n p n p q X^*=\frac{X-np}{\sqrt {npq}} X∗=npqX−np
- 略
- λ 2 + λ \lambda^2+\lambda λ2+λ, λ \lambda λ, ( b − a ) 2 / 12 (b-a)^2/12 (b−a)2/12
- 略
- v a r ( X + Y ) = v a r ( X ) + v a r ( Y ) + 2 c o v ( X , Y ) var(X+Y)=var(X)+var(Y)+2cov(X,Y) var(X+Y)=var(X)+var(Y)+2cov(X,Y),和的方差等于方差的和。
相关性、几何意义
- 古典概型中的随机变量为什么其实就是有限维向量(提示:对偶空间)?那么内积、正交、夹角是什么?
- 垂直于非零常值随机变量的随机变量是什么?利用此解释 X = ( X − E X ) ⊕ E X X=(X-EX)\oplus EX X=(X−EX)⊕EX.
- 相关系数和0.中夹角余弦有何异同?
- 无关,正(负)相关,完全正相关分别有何几何意义?
- 两个事件的独立(无关)、正相关、负相关是考察哪个式子的符号?这个式子是哪两个随机变量的协方差?这个式子绝对值上界是多少?
- 背诵二元正态分布的协方差矩阵和利用标准化后的变量表示的原变量的概率密度(即 p ( x , y ) = ⋯ p(x,y)=\cdots p(x,y)=⋯,右边表达式出现 u , v u,v u,v),从直觉上解释 e e e指数项中 u v uv uv的符号。
- 为了证明 ρ \rho ρ表示相关系数,先把 X , Y X,Y X,Y标准化成 X ∗ , Y ∗ X^*,Y^* X∗,Y∗,则标准化后变量的协方差矩阵是什么?为了快速计算 E X ∗ Y ∗ EX^*Y^* EX∗Y∗,用了()次随机变量期望用概率密度积分表示的表达式。
- 协方差矩阵半正定,是因为 x ⃗ T Σ x ⃗ \vec x^T\Sigma \vec x xTΣx能表示成某个非负随机变量即()的期望。考察该非负随机变量取恒为0的充要条件,我们得到 Σ \Sigma Σ正定的充要条件是()不能非零线性组合出几乎恒为0的随机变量。(上个括号中填 n n n个随机变量)(这么费劲描述是为了避免“线性无关”一词歧义)
答案
- 提示:内积对应 E X Y EXY EXY.
- 期望为0的随机变量。(注:这帮助我们理解记号 R ⊥ \mathbb R^\perp R⊥的含义) X = X − E X + E X X=X-EX+EX X=X−EX+EX且两个加数无关(正交)
- 相关系数:做标准化了。注意向量数乘正数不改变“方向”
- 考察(标准化后)夹角。
- P ( A B ) − P ( A ) P ( B ) P(AB)-P(A)P(B) P(AB)−P(A)P(B), 1 A , 1 B 1_A,1_B 1A,1B, 1 / 4 1/4 1/4(考察相关系数)
- Σ = ( σ 1 2 ρ σ 1 σ 2 ρ σ 1 σ 2 σ 2 2 ) , p ( x , y ) = 1 2 π σ 1 σ 2 1 − ρ 2 e x p ( − u 2 + v 2 − 2 ρ u v 2 ( 1 − ρ 2 ) ) \Sigma=\left(\begin{matrix}\sigma_1^2&\rho\sigma_1\sigma_2\\\rho\sigma_1\sigma_2&\sigma_2^2\end{matrix}\right),p(x,y)=\frac1{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}exp(-\frac{u^2+v^2-2\rho uv}{2(1-\rho^2)}) Σ=(σ12ρσ1σ2ρσ1σ2σ22),p(x,y)=2πσ1σ21−ρ21exp(−2(1−ρ2)u2+v2−2ρuv)(注意不是 p ( u , v ) p(u,v) p(u,v))。正相关时 u v uv uv大的区域概率密度大。
- 提示: σ 1 = σ 2 = 1 \sigma_1=\sigma_2=1 σ1=σ2=1. 括号处填:2.
- ( ∑ i x i ( X i − μ i ) ) 2 (\sum_i x_i(X_i-\mu_i))^2 (∑ixi(Xi−μi))2, X i − μ i , i = 1 , ⋯ , n X_i-\mu_i,i=1,\cdots,n Xi−μi,i=1,⋯,n
最优预测
- 对于随机变量构成的线性空间空间 W W W中的给定随机变量 Y Y Y,子空间 W 0 W_0 W0,我们在()中找随机变量 Y ^ \hat Y Y^使得()最小,则 Y ^ \hat Y Y^是“垂足”,也就是对于任意其它的()中随机变量 V V V,我们有() = = =() + + +() ≥ \ge ≥()(提示:正交分解)
- 对于子空间 W 0 W_0 W0取 R \mathbb R R,假设最佳预测是实数 r ∗ r^* r∗,对于任意实数 r r r,此时必须有 E ( Y − r ) 2 ≥ E(Y-r)^2\ge E(Y−r)2≥()且等号当且仅当()时成立。对比普遍成立的式子 E ( Y − r ) 2 = E ( Y − r ∗ ) 2 + ( r − r ∗ ) 2 + 2 ( r ∗ − r ) E ( Y − r ∗ ) E(Y-r)^2=E(Y-r^*)^2+(r-r^*)^2+2(r^*-r)E(Y-r^*) E(Y−r)2=E(Y−r∗)2+(r−r∗)2+2(r∗−r)E(Y−r∗),我们得到()处 E ( Y − r ) E(Y-r) E(Y−r)关于()的导数等于(),从而得到结论()。请把以上过程与求点到直线的垂足坐标做类比。
- 由1. 给出 Y − r Y-r Y−r的正交分解,并解释 r = E Y r=EY r=EY和 r = 0 r=0 r=0分别有何含义。
- 假设统计数据中 Y Y Y关于某一均值为0的随机变量 X X X呈线性关系( Y Y Y从数据上看近似满足 Y = a + b X Y=a+bX Y=a+bX)(小心“线性相关”一词的歧义!),则子空间 W 0 W_0 W0取()。本题相比1.来说,要决定的待定参数变为2个,我们可以先利用1.决定一个,请简述决定依据。
- 接上,还有一个参数如何决定?(类比1.进行计算)
- 由上给出 Y − ( a + b X ) Y-(a+bX) Y−(a+bX)的正交分解。
- 对于子空间 { ψ ( X ) : E ψ ( X ) 2 < ∞ } \{\psi (X):E\psi(X)^2<\infty\} {ψ(X):Eψ(X)2<∞},类比1.我们要求(),也就是 E ( ( Y − ψ ∗ ( X ) ) ( ψ ( X ) − ψ ∗ ( X ) ) E((Y-\psi^*(X))(\psi(X)-\psi^*(X)) E((Y−ψ∗(X))(ψ(X)−ψ∗(X))关于 ψ \psi ψ在 ψ ∗ \psi^* ψ∗附近为极值。为了绕过变分法,我们想考察任意确定 X = x 0 X=x_0 X=x0处的情况,从而得到结果:应该取()
答案
- W 0 W_0 W0, E ( Y − Y ^ ) 2 E(Y-\hat Y)^2 E(Y−Y^)2, W 0 W_0 W0, E ( Y − V ) 2 E(Y-V)^2 E(Y−V)2, E ( Y − Y ^ ) 2 E(Y-\hat Y)^2 E(Y−Y^)2, E ( Y ^ − V ) 2 E(\hat Y-V)^2 E(Y^−V)2, E ( Y − Y ^ ) 2 E(Y-\hat Y)^2 E(Y−Y^)2
- E ( Y − r ∗ ) 2 , r = r ∗ E(Y-r^*)^2,r=r^* E(Y−r∗)2,r=r∗, r ∗ r^* r∗, r r r,0, 2 r − 2 r ∗ − 2 E ( Y − r ∗ ) = 0 , r ∗ = E Y 2r-2r^*-2E(Y-r^*)=0,r^*=EY 2r−2r∗−2E(Y−r∗)=0,r∗=EY. 略。
- Y − r = ( Y − E Y ) ⊕ ( E Y − r ) Y-r=(Y-EY)\oplus (EY-r) Y−r=(Y−EY)⊕(EY−r). 略。
- { a + b X ∣ a , b ∈ R } \{a+bX|a,b\in \mathbb R\} {a+bX∣a,b∈R},先决定常数项 a a a的最佳估计值 a ^ \hat a a^(注意 E ( Y − b X ) = E Y E(Y-bX)=EY E(Y−bX)=EY)
- b ^ = c o v ( X , Y ) / v a r ( X ) \hat b = cov(X,Y)/var(X) b^=cov(X,Y)/var(X)
- Y − ( a + b X ) = ( Y − Y ^ ) ⊕ ( a ^ − a ) ⊕ ( b ^ − b ) X Y-(a+bX)=(Y-\hat Y)\oplus (\hat a-a) \oplus(\hat b-b)X Y−(a+bX)=(Y−Y^)⊕(a^−a)⊕(b^−b)X
- E ( Y − ψ ( X ) ) 2 ≥ E ( Y − ψ ∗ ( X ) ) 2 E(Y-\psi(X))^2\ge E(Y-\psi^*(X))^2 E(Y−ψ(X))2≥E(Y−ψ∗(X))2且等号当且仅当 ψ ∗ = ψ \psi^*=\psi ψ∗=ψ时成立, ψ ∗ ( x 0 ) = E ( Y ∣ X = x 0 ) \psi^*(x_0)=E(Y|X=x_0) ψ∗(x0)=E(Y∣X=x0)