《随机变量的数字特征》（至马尔可夫大数定律）_2021秋季《概率论与数理统计》复习笔记2.0_基于浙大第五版和华东师大版

最新推荐文章于 2024-07-21 21:42:58 发布

rd142857

最新推荐文章于 2024-07-21 21:42:58 发布

阅读量847

点赞数

分类专栏：概率论文章标签：概率论线性代数矩阵

本文链接：https://blog.csdn.net/rd142857/article/details/121304296

版权

概率论专栏收录该内容

6 篇文章 0 订阅

订阅专栏

数学期望

试验次数很大时，随机变量 $X$ 的观察值的算术平均。

以下各极限情况均要求绝对收敛。

性质

线性
独立性， $E (X Y) = E (X) E (Y)$

特殊的数学期望

泊松分布

$E(X)=\sum_{k=0}^{+\infin} k\frac{\lambda^k e^{-\lambda}}{k!}=\lambda e^{-\lambda}\sum_{k=1}^{+\infin}\frac{\lambda^{k-1}}{(k-1)!}=\lambda e^{-\lambda}\cdot e^\lambda=\lambda$

最后一个等号运用了泰特展开。

均匀分布

$E(X)=\int_{-\infin}^{+\infin} xf(x){\rm d}x=\int_a^b x\frac{1}{b-a}{\rm d}x=\frac{a+b}{2}$

随机变量的函数的数学期望

正态分布

$X\sim N(0,1)$

奇函数
$E(Y)=\int_{-\infin}^{+\infin}\frac{y}{\sqrt{2\pi}}e^{-\frac{y^2}{2}}{\rm d}y=0$
偶函数
$\begin{aligned} E(|Y|) &=\int_{-\infin}^{+\infin}\frac{|y|}{\sqrt{2\pi}}e^{-\frac{y^2}{2}}{\rm d}y \\ &=\frac{2}{\sqrt{2\pi}}\int_{0}^{+\infin} y e^{-\frac{y^2}{2}}{\rm d}y \\ &=\frac{2}{\sqrt{2\pi}}\int_{0}^{+\infin}e^{-\frac{y^2}{2}}{\rm d}{(\frac{y^2}2)} \\ &=\sqrt{\frac{2}{\pi}} \end{aligned}$

$X\sim(0,\sigma^2)$

已知标准正态分布的绝对值的数学期望 $E (∣ Y ∣)$ ，由数学期望的线性性质，
$E(|X|)=E(\sigma\cdot |\frac{X}{\sigma}|)=\sigma \sqrt{\frac{2}{\pi}}$

$X\sim N(\mu,\sigma^2)$

已知标准正态分布的数学期望 $E (Y)$ 为 $0$ ，由数学期望的线性性质，
$E(X)=E(\sigma\cdot\frac{X-\mu}{\sigma}+\mu)=\sigma\cdot 0+\mu=\mu$

方差

描述偏离程度。
$E[|X-E(X)|]\rightarrow E\{[X-E(X)]^2\}$

与期望

$D(X)=E(X^2)-[E(X)]^2$

证明

$\begin{aligned} D(X) &= E\{[X-E(X)]^2\} \\ &= E\{X^2-2XE(X)+[E(X)]^2\} \\ &= E(X^2)-2E(X)E(X)+[E(X)]^2 \\ &= E(X^2)-[E(X)]^2 \end{aligned}$

性质

$D(CX)=C^2 D(X),D(X+C)=D(X)$
$D(X+Y)=D(X)+D(Y)+2E\{[X-E(X)][Y-E(Y)]\}$

$X, Y$ 独立时， $D (X + Y) = D (X) + D (Y)$
$D(X)=0\Leftrightarrow P\{X=E(X)\}=1$

证明

- 左向
  $P\{X=E(X)\}=1\Rightarrow P\{X^2=E^2(X)\}=1,D(X)=E(X^2)-E^2(X)=1-1=0$
- 右向
  
  反证法，假设 $P\{X=E(X)\}<1$ ，则 $\exist \varepsilon$ ，使得 $P\{|X-E(X)|\geq\varepsilon\}>0$ .但根据[切比雪夫不等式](# 切比雪夫不等式)， $\forall \varepsilon,P\{|X-E(X)|\geq\varepsilon\}\leq\frac{0}{\varepsilon}=0$ ，与假设矛盾。

标准化变量

在这里插入图片描述

特殊的方差

二项分布

$0 - 1$ 分布

$E(X)=0\times (1-p)+1\times p=p,\quad D(X)=p(1-p)$

一般

$\begin{cases} 1, & A在第k次试验中发生\\ 0, & A在第k次试验中不发生 \end{cases}$

$X=X_1+X_2+\cdots +X_n$

相当于 $n$ 各相互独立且服从以 $p$ 为参数的 $0 - 1$ 分布的随机变量之和，于是
$E(X)=E(\sum X_i)=\sum(E(X_i))=np,D(X)=D(\sum X_i)=\sum(D(X_i))=np(1-p)$

泊松分布

第一个等号为了凑阶乘
$\begin{aligned} E(X^2) &= E(X(X-1)+X) = E(X(X-1))+E(X) \\ &= \sum_{k=0}^{+\infin} k(k-1)\frac{\lambda^k}{k!} e^{-\lambda}+\lambda \\ &= \lambda^2 e^{-\lambda} \sum_{k=2}^{+\infin} \frac{\lambda^{k-2}}{(k-2)!}+\lambda \\ &= \lambda^2 e^{-\lambda}\cdot e^\lambda +\lambda \\ &= \lambda^2+\lambda \end{aligned}$

$D(X)=E(X^2)-[E(X)]^2=\lambda^2+\lambda-\lambda^2=\lambda$

正态分布

$X\sim N(0,1)$

$\begin{aligned} E(Z) &= \frac{1}{\sqrt{2\pi}}\int_{-\infin}^{+\infin} te^{-t^2/2}{\rm d}t=0 \\ D(Z) &= E(Z^2) \\ &= \frac{1}{\sqrt{2\pi}}\int_{-\infin}^{+\infin} t^2e^{-t^2/2}{\rm d}t \\ &= \frac{-1}{\sqrt{2\pi}}te^{-t^2/2}|_{-\infin}^{+\infin}+\frac{1}{\sqrt{2\pi}}\int_{-\infin}^{+\infin} e^{-t^2/2}{\rm d}t \\ &= 1+0=1 \end{aligned}$

$X\sim N(\mu,\sigma^2)$

由于 $X=\mu+\sigma Z$ ，
$\begin{aligned} E(X) &= E(\mu+\sigma Z) = \mu \\ D(x) &= D(\mu+\sigma Z) = D(\sigma Z) = \sigma^2 D(Z)=\sigma^2 \end{aligned}$
由此可证正态分布的线性不变性。

切比雪夫不等式

$P\{|X-\mu|\geq\varepsilon\}\leq \frac{\sigma^2}{\varepsilon^2}$

证明

$\begin{aligned} P\{|X-\mu|\geq \varepsilon\} &= \int_{|x-\mu|\geq \varepsilon} f(x){\rm d}x \\ &\leq \int_{|x-\mu|\geq \varepsilon} \frac{|x-\mu|^2}{\varepsilon^2}f(x){\rm d}x \\ &\leq \frac{1}{\varepsilon^2}\int_{-\infin}^{+\infin}|x-\mu|^2 f(x){\rm d}x = \frac{\sigma^2}{\varepsilon^2} \end{aligned}$

变式

$P\{|X-\mu|\leq\varepsilon\}\geq 1-\frac{\sigma^2}{\varepsilon^2}$

协方差与相关系数

刻画不独立的随机变量之间的关系： $Y$ 如何随 $X$ 的变化而变化。

以 $X = E X, Y = E Y$ 分割的四个“象限”中，一三象限意味着 $(X - E X) (Y - E Y) > 0$ ，二四象限意味着 $(X - E X) (Y - E Y) < 0$ ， $X, Y$ 图像落在各个象限中的面积的“权重”可以用 $E (X - E X) (Y - E Y)$ 衡量。

在这里插入图片描述

协方差

${\rm Cov}(X,Y)=E[(X-EX)(Y-EY)]$

性质

若 $X, Y$ 相互独立，则 ${\rm Cov}(X,Y)=0$

逆命题不成立：独立是比相关更强的条件
${\rm Cov}(X,Y)={\rm Cov}(Y,X)$
${\rm D}(X)={\rm Cov}(X,X)$
- ${\rm Cov}(X,a)=0$
  
  任意随机变量不随一个常数的变化而变化
- ${\rm Cov}(aX+b,cY+d)=ac{\rm Cov}(X,Y)$
  
  左右平移不影响方差和协方差，只影响期望（因为要中心化）
协方差的常用计算方法
${\rm Cov}(X,Y)=E(XY)-EXEY$

但正态分布用定义计算更方便，因为本就要去中心化
${\rm Cov}(X+Y,Z)={\rm Cov}(X,Z)+{\rm Cov}(Y,Z)$

${\rm Cov}(aX_1+bX_2,cY_1+dY_2)=ac{\rm Cov}(X_1,Y_1)+ad{\rm Cov}(X_1,Y_2)+bc{\rm Cov}(X_2,Y_1)+bd{\rm Cov}(X_2,Y_2)$
${\rm D}(X\pm Y)={\rm D}(X)+{\rm D}(Y)+2{\rm Cov}(X,Y)$

矩和其他数字特征

矩

概念

原点矩 $\mu_k$

$E(X^k),\quad k=1,2,\cdots$

$X$ 的 $k$ 阶原点矩，简称 $k$ 阶矩。

混合矩

$E(X^k Y^l),\quad k,l=1,2,\cdots$

$X$ 和 $Y$ 的 $k + l$ 阶混合矩。

中心矩 $v_k$

$E\{[X-E(X)]^k\},\quad k=1,2,\cdots$

$X$ 的 $k$ 阶中心矩。

混合中心矩

$E\{[X-E(X)]^k[Y-E(Y)]^l\},\quad k,l=1,2,\cdots$

$X$ 和 $Y$ 的 $k + l$ 阶混合中心矩。

性质

$\mu_1=EX,v_1=0,v_2=DX$
直接展开，
$v_k=\sum_{i=0}^k C_k^i \mu_i(-1)^{k-i}\mu_1^{k-i}$
通常用 $v_3$ 度量随机变量的对称程度（ $v_3$ 越小越对称）

其他数字特征

系数

偏度系数

skewness
$\beta_s=\frac{v_3}{\sigma^3},\sigma=\sqrt{v_2}$
在 $v_3$ 的基础上进行标准化，同样衡量随机变量的对称性。

在这里插入图片描述

峰度系数

kurtosis
$\beta_k=\frac{v_4}{v_2^2}-3$
若设 $X^*=\frac{X-EX}{\sqrt{DX}}$ ，则 $\beta_k=E[(X^*)^4]-3$ .

在这里插入图片描述

变异系数

$C_v=\frac{\sqrt{v_2}}{\mu_1}$

在这里插入图片描述

内部

分位数

中位数

在这里插入图片描述

极限定理

中心极限定理

客观背景

在客观实际中有许多随机变量，它们是由大量的相互独立的随机因素的综合影响所形成的。而其中每一个别因素在总的影响中所起的作用都是微小的。这种随机变量往往近似地服从正态分布。

例如二项分布、泊松分布、卡方分布等。

内容

称随机变量序列 $\{X_n,n\geq 1\}$ 服从中心极限定理，若当 $n\rightarrow +\infin$ 时，随机变量之和 $S_n=\sum_{i=1}^n X_i$ 渐进服从正态分布。

即 $\frac{S-ES_n}{\sqrt{DS_n}}$ 的分布函数 $F_n(x)$ 收敛于 $\Phi(x)$ 。

借用知乎老哥理解，

在这里插入图片描述

林德贝格-勒维中心极限定理

若随机变量序列独立同分布，数学期望为 $\mu$ ，方差为 $\sigma^2$ ，则对任意实数 $y$ ，
$\lim_{n\rightarrow \infin}P\{\frac{\sum_{k=1}^n X_k-n\mu}{\sigma\sqrt{n}}\leq y\}=\Phi(y)$

近似计算

$P\{a\leq S_n\leq b\}\approx \Phi(\frac{b-n\mu}{\sigma\sqrt{n}})-\Phi(\frac{a-n\mu}{\sigma\sqrt{n}})$

德莫夫-拉普拉斯中心极限定理

对于二项分布，设 $Y_n\sim b(n,p)$ ，则
$\lim_{n\rightarrow \infin}P\{\frac{Y_n-np}{\sqrt{np(1-p)}}\}\approx \Phi(y)$

近似计算

修正

由于二项分布是离散分布，正态分布是连续分布，
$P\{k_1\leq Y_n\leq k_2\}=P\{k_1-0.5<Y_n<k_2+0.5\} \approx \Phi(\frac{k_2+0.5-np}{\sqrt{np(1-p)}})-\Phi(\frac{k_1-0.5-np}{\sqrt{np(1-p)}})$

大数定律

客观背景

随着试验次数的增加，事件发生的频率逐渐稳定于某个常数。类似地，大量测量值的算术平均值也具有上述稳定性。

概率收敛

设随机变量 $X,X_1,X_2,\cdots$ 都定义在同一个概率空间中，如果 $\forall \epsilon>0$ ，都有 $\lim_{n\rightarrow \infin} P(|X_n-X|\geq \epsilon)=0$ 成立，则称随机变量序列 $X_1,X_2,\cdots$ 依概率收敛到 $X$ 。通常记为 $X_n\stackrel{P}\longrightarrow X$ .

$X_n\stackrel{P}\longrightarrow X$ 当且仅当 $X_n-X\stackrel{P}\longrightarrow 0$ .

内容

称随机变量序列 $X_1,X_2,\cdots$ 服从大数定律，若
$\frac{S_n-ES_n}{n}\stackrel{P}\longrightarrow 0$

马尔可夫大数定律

Markov

若方差 $D(X_i)$ 存在，且 ${\rm Markov}$ 条件
$\lim_{n\rightarrow \infin} \frac{1}{n^2}D(\sum_{k=1}^n X_k)=0$
成立，则该随机变量序列服从大数定律。

rd142857

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
《随机变量的数字特征》（至马尔可夫大数定律）_2021秋季《概率论与数理统计》复习笔记2.0_基于浙大第五版和华东师大版

# 数学期望试验次数很大时，随机变量XXX的观察值的算术平均。以下各极限情况均要求绝对收敛。性质线性独立性，E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)E(XY)=E(X)E(Y)特殊的数学期望泊松分布E(X)=∑k=0+∞kλke−λk!=λe−λ∑k=1+∞λk−1(k−1)!=λe−λ⋅eλ=λE(X)=\sum_{k=0}^{+\infin} k\frac{\lambda^k e^{-\lambda}}{k!}=\lambda e^{-\lambda}\sum_
复制链接

扫一扫