第六章极限定理（概率论）

最新推荐文章于 2023-05-22 20:27:10 发布

xxatz

最新推荐文章于 2023-05-22 20:27:10 发布

阅读量552

点赞数

分类专栏：高数菜鸡之概率统计文章标签：数学矩阵概率论

本文链接：https://blog.csdn.net/xxayt/article/details/121597575

版权

高数菜鸡之概率统计专栏收录该内容

8 篇文章 0 订阅

订阅专栏

文章目录

第六章极限定理

第六章极限定理

6.1 大数定律 Law of large numbers

6.1.1 切比雪夫不等式

切比雪夫不等式：对任意 $\varepsilon>0$ ，
$\color{red}P(|X-E(X)|<\varepsilon)\ge 1-\dfrac{D(X)}{\varepsilon^2}$
- 证明：设 $X$ 有密度函数 $f (x)$
  $\begin{aligned} P(|X-E(X)|\ge \varepsilon)&=\int_{|x-E(X)|\ge \varepsilon}f(x)dx\\ (放大被积函数)&\le\int_{|x-E(X)|\ge \varepsilon}\dfrac{[X-E(X)]^2}{\varepsilon^2}f(x)dx\\ (放大积分限)&\le \dfrac{1}{\varepsilon^2}\int_{-\infty}^{+\infty}[X-E(X)]^2f(x)dx\\ &=\dfrac{D(X)}{\varepsilon^2} \end{aligned}$
- 说明：事件 $(|X-E(X)|\ge \varepsilon)$ 的概率与 $D (X)$ 有关，且 $D (X)$ （即 $X$ 取值集中在期望 $E (X)$ 周围的程度）越小，这个事件概率应越大。
- 作用：已知 $E (X), D (X)$ ，而未知 $X$ 分布时，可对事件 $(|X-E(X)|\ge \varepsilon)$ 发生的概率进行估计。
- 缺点：误差较大
随机变量序列的收敛性：
- 依概率收敛：对 $\forall \varepsilon>0$ ，有 $\color{red}\lim\limits_{n\rightarrow \infty}P(|X_n-a|<\varepsilon)=1$ ，则称随机变量序列 $X_1,X_2,...,X_n$ 依概率收敛于常数 $a$ ，记为 $\color{red}X_n\xrightarrow{P} a$
- 区别：
  1. 数列收敛 $x_n\rightarrow a$ ： $\forall \varepsilon>0,\exist N$ ，当 $n > N$ 时，有 $|x_n-a|<\varepsilon$
  2. 随机变量序列收敛 $X_n\xrightarrow{P} a$ ： $\forall \varepsilon>0,\exist N$ ，当 $n > N$ 时，有 $\{|X_n-a|<\varepsilon\}=\{X_n\in \delta(a,\varepsilon)\}$ .
- $\color{White}\colorbox{Fuchsia}{例题}$ ： $(X,Y)\sim N(2,-1;1,4;-0.5),P\{|X+Y|\ge 6\}\le \;\_\_?\_\_$
  
  解：
  $E(X+Y)=0,D(X+Y)=1+4+2\times (-0.5)\times 2\times 1=3\\ P\{|X+Y|\ge 6\}\le\dfrac{D(X)}{\varepsilon^2}=\dfrac{3}{36}=\dfrac{1}{12}$
切比雪夫不等式的应用：随机变量序列 ${X_n\},n=1,2,...$ ，若 $E(X_n)=\mu_n,D(X_n)=\sigma_n^2$ 存在，且满足 $n\rightarrow \infty$ ，有 $\sigma^2\rightarrow 0$ ，则 $\color{red}X_n-\mu_n\xrightarrow{P}0$
- 证明： $1\ge P(|X_n-\mu_n|<\varepsilon)\ge 1-\dfrac{\sigma_n^2}{\varepsilon^2}$ 两边取极限即可

6.1.2 大数定律

大数定律研究对象： $\xi_n=\dfrac{1}{n}\sum\limits_{i=1}^nX_i$

大数定律常用工具：切比雪夫不等式

大数定律本质： $\dfrac{1}{n}\sum\limits_{i=1}^nX_i\xrightarrow{P} E(\dfrac{1}{n}\sum\limits_{i=1}^nX_i)$

大数定律成立的约束条件：一二阶矩存在；方差趋于零

意义：平均使得稳定；规律的产生是大量独立或弱相关因素累计的结果。

切比雪夫大数律：对独立随机变量 ${X_n\}$ 若满足
1. $E(X_n),D(X_n)$ 都存在
2. 方差有限，即存在常数 $C$ ，使得 $D(X_k)\le C$ ，则有 $\color{red}\dfrac{1}{n}\sum\limits_{k=1}^nX_k-\dfrac{1}{n}\sum\limits_{k=1}^nE(X_k)\xrightarrow{P}0$
- 证明：令 $Y_n=\dfrac{1}{n}\sum\limits_{k=1}^nX_k$ ，则
  $\begin{aligned} E(Y_n)&=E\left(\dfrac{1}{n}\sum\limits_{k=1}^nX_k\right)=\dfrac{1}{n}E\left(\sum\limits_{k=1}^nX_k\right)=\dfrac{1}{n}\sum\limits_{k=1}^nE\left(X_k\right),\\ D(Y_n)&=D\left(\dfrac{1}{n}\sum\limits_{k=1}^nX_k\right)=\dfrac{1}{n^2}D\left(\sum\limits_{k=1}^nX_k\right)\\ &=\dfrac{1}{n^2}\left[\sum\limits_{k=1}^nD(X_k)+2\sum\limits_{1\le i<j\le n}r_{ij}\sqrt{D(X_i)}\sqrt{D(X_j)}\right]\xlongequal{i.i.d.}\dfrac{D(X_n)}{n}\\ 故&当n\longrightarrow \infty时，D(y_n)\longrightarrow 0,有Y_n-E(Y_n)\xrightarrow{P}0.\\ 即&\dfrac{1}{n}\sum\limits_{k=1}^nX_k-\dfrac{1}{n}\sum\limits_{k=1}^nE(X_k)\xrightarrow{P}0 \end{aligned}\\$
独立同分布大数律：记 $\overline{X}=\dfrac{1}{n}\sum\limits_{k=1}^nX_k$ ，则 $\color{red}\overline{X}\xrightarrow{P}E(X_k)$ ，其中 $(X_k)=E(\overline{X})$ 。
- 说明： $n$ 充分大时， $\overline{X}$ 在概率意义下取值充分接近 $X_k$ 的共同期望。故实际问题可用 $\overline{X}$ 估计 $E(X_k)$ ，即多次测量求平均作为期望值。
伯努利大数律： $n$ 次伯努利实验中， $\color{red}f_n(A)\xrightarrow{P}p$ ，其中 $f_n(A)=\dfrac{n_A}{n}$ 为事件 $A$ 发生的频率， $p = P (A)$ 为 $A$ 发生的概率。
- 说明：频率 $f_n(A)$ 的稳定值 $P (A)$ 实际上是频率依概率收敛于 $P (A)$ 。故 $n$ 较大时，可用事件频率估计事件发生概率。

6.2 中心极限定理 Central Limit Theorems

中心极限定理研究对象：独立的随机变量之和

中心极限定理本质：任意独立同分布的随机变量之和的极限分布是正态分布

林德伯格-列维中心极限定理(独立同分布)：独立同分布的随机变量序列 ${X_k\}$ 有 $E(X_k)=\mu,D(X_k)=\sigma^2>0,k=1,2,...$ ，记 $Y_n=\dfrac{\sum\limits_{k=1}^nX_k-n\mu}{\sqrt{n}\sigma}=\dfrac{\dfrac{1}{n}\sum\limits_{k=1}^nX_k-\mu}{\dfrac{\sigma}{\sqrt{n}}}$ ，则对任意 $x\in R$ ，有
$\color{red}\lim\limits_{n\rightarrow \infty}F_n(x)=\lim\limits_{n\rightarrow \infty}P(Y_n\le x)=\Phi(x)$
- 说明：独立同分布的随机变量之和 $S_n=\sum\limits_{k=1}^nX_k$ 标准化后 $Y_n=\dfrac{S_n-E(S_n)}{\sqrt{D(S_n)}}$ 的分布函数的极限函数是标准正态分布。
- 应用：当 $n\longrightarrow \infty$ 时，
  $\sum\limits_{k=1}^nX_k\sim N(n\mu,n\sigma^2)\\ \dfrac{1}{n}\sum\limits_{k=1}^nX_k\sim N(\mu,\dfrac{\sigma^2}{n})\\ \sum\limits_{k=1}^ng(X_i)\sim N({\color{red}(g(X)),nD(g(X))})\\ P(a<\sum\limits_{k=1}^nX_k\le b)\approx\Phi(\dfrac{b-n\mu}{\sqrt{n}\sigma})-\Phi(\dfrac{a-n\mu}{\sqrt{n}\sigma})$
棣莫弗-拉普拉斯中心极限定理(二项分布)：随机变量序列 $\{X_k\}\sim B(n,p),q=1-p$ ，则对任意 $x\in R$ ，有
$\color{red}\lim\limits_{n\rightarrow \infty}P(\dfrac{X_n-np}{\sqrt{npq}} \le x)=\Phi(x)$
- 说明：二项分布的渐近正态性
- 推论： $X\sim B(n,p)$ ，当 $n\longrightarrow\infty$ 时，有 $\color{red}P(a<X\le b)\approx\Phi(\dfrac{b-np}{\sqrt{npq}})-\Phi(\dfrac{a-np}{\sqrt{npq}})$
- $\color{White}\colorbox{Fuchsia}{例题}$ ：某厂生产的产品中，一等品率为 $80\%$ ，用中心极限定理完成
  
  （1）若一盒产品装有 $100$ 个，求一盒中至少有 $85$ 个一等品的概率
  
  解：
  $X\sim B(100,0.8),则np=80,npq=16,近似地X\sim N(80,16)\\ 设 X为一等品数量\\ \therefore P(X\ge 85)\approx 1-\Phi(\dfrac{85-80}{\sqrt{16}})=1-\Phi(1.25)=1-0.8944=0.1056$
  （2）设一盒装有 $n$ 个产品，若要求至少有 $70\%$ 的产品为一等品概率不低于 $0.9772$ ，则 $n$ 至少应该取多少
  
  解：
  $X为一等品数量,\therefore X\sim N(0.8n,0.16n) \\ \begin{aligned} \therefore P(X\ge 0.7n)\approx 1-\Phi(\dfrac{0.7n-0.8n}{0.4\sqrt{n}})&\ge 0.9772\\ 1-\Phi(-\dfrac{\sqrt{n}}{4})&\ge \Phi(2)\\ -2&\ge -\dfrac{\sqrt{n}}{4}\\ \therefore n&\ge 64 \end{aligned}$
频率估计概率问题：计算 $P(|\dfrac{\mu_n}{n}-p|<\varepsilon)=\beta$ ，其中样本量 $n$ ，期望概率 $p$ ，误差 $\varepsilon$ ，事件发生概率 $\beta$ ，知三求一。
$\because \dfrac{\mu_n}{n}\sim N(p,\dfrac{pq}{n})\therefore \dfrac{\dfrac{\mu_n}{n}-p}{\sqrt{\dfrac{pq}{n}}}\sim N(0,1)\\ \Longrightarrow{\color{red}\beta=P(|\dfrac{\mu_n}{n}-p|<\varepsilon)}=F(p+\varepsilon)-F(p-\varepsilon)=\Phi(\dfrac{p+\varepsilon-p}{\sqrt{\dfrac{pq}{n}}})-\Phi(\dfrac{p-\varepsilon-p}{\sqrt{\dfrac{pq}{n}}}) =\color{red}2\Phi(\varepsilon\sqrt{\dfrac{n}{pq}})-1$