前言
讨论的是随机变量序列渐进(在 n → ∞ n\rightarrow \infty n→∞时的)性质.为使用有限样本进行统计推断提供了理论基础。
X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn是独立同分布的随机变量序列.均值均为 μ \mu μ,标准差 σ \sigma σ.定义序列 S n S_n Sn:
S n = X 1 + X 2 + . . . + X n S_n=X_1+X_2+...+X_n Sn=X1+X2+...+Xn
基本性质:
- v a r ( S n ) = n σ 2 var(S_n)=n\sigma ^2 var(Sn)=nσ2,方差是发散的, S n S_n Sn肯定不收敛(收敛时方差为0)。 E ( S n ) = n μ , S n E(S_n)=n\mu ,S_n E(Sn)=nμ,Sn发散。
- 样本均值 M n = S n n M_n=\frac{S_n}{n} Mn=nSn
- E ( M n ) = μ , v a r ( M n ) = v a r ( S n ) n 2 = σ 2 n E(M_n)=\mu ,var(M_n)=\frac{var(S_n)}{n^2}=\frac{\sigma ^2}{n} E(Mn)=μ,var(Mn)=n2var(Sn)=nσ2,样本均值的期望收敛于随机变量的期望,方差趋于0,说明样本均值趋近于随机变量的期望。(大数定律)
- 构造随机变量序列 Z n = S n − n μ σ n Z_n=\frac{S_n-n\mu}{\sigma \sqrt n} Zn=σnSn−nμ,这个式子分子是 S n S_n Sn对 E ( S n ) E(S_n) E(Sn)的偏移,绝对偏移是不太好的,所以分母带上了 S n S_n Sn的标准差。 E ( Z n ) = 0 , v a r ( Z n ) = 1 E(Z_n)=0,var(Z_n)=1 E(Zn)=0,var(Zn)=1,这说明 Z n Z_n Zn既不发散也不收敛。(中心极限定理)
马尔可夫和切比雪夫不等式
这两个不等式的作用是利用均值和方差去分析事件的概率。随机变量的均值和方差易于计算,但分布不知道时有用。
马尔可夫不等式
马尔可夫不等式:随机变量 X ≥ 0 , ∀ a &