概统考前瞄一眼(上)

最新推荐文章于 2024-07-19 18:29:09 发布

bay7447_坤艮

最新推荐文章于 2024-07-19 18:29:09 发布

阅读量356

点赞数 1

分类专栏：概率论文章标签：概率论

本文链接：https://blog.csdn.net/weixin_52921802/article/details/125255377

版权

概率论专栏收录该内容

2 篇文章 0 订阅

订阅专栏

概统复习

一、事件与概率

事件与运算

随机试验—— $E$ 为一个试验，若满足
- 相同条件下可重复
- 试验结果具有多样性；试验前所有可能结果已知
- 试验前不确定何种结果发生
- 称为随机试验
样本空间—— $E$ 为随机试验， $E$ 的所有可能的基本结果而成集合，称为 $E$ 的样本空间 $\Omega$
随机事件—— $E$ 为随机试验， $\Omega$ 为 $E$ 的样本空间， $\Omega$ 的子集称为随机事件
和、积、差、补运算，包含、相等、互斥、对立关系
- $A = (A - B) + A B$

概率、基本公式

概率—— $E-随机试验，\Omega-样本空间，\forall A\subset\Omega$ ，定义 $P (A)$ ，若满足
- $\forall A\subset\Omega，有P(A)\geq 0$ (非负性)
- $p(\Omega) = 1$ (归一性)
- 设 $A_1,A_2,\cdots,A_n,\cdots$ 两两互斥，有 $P(A_1+A_2+\cdots)=P(A_1)+P(A_2)+\cdots$ (可列可加性)
- 称 $P (A)$ 为事件 $A$ 的概率
性质
- $P(\varnothing) = 0$
- 有限可加性
- $A+\overline{A}=\Omega,且A·\overline{A}=\varnothing$
基本公式
- 减法公式： $(A-B)+AB\Rightarrow P(A-B)=P(A\overline{B})=P(A)-P(AB)$
- 加法公式： $P (A + B) = P (A) + P (B) - P (A B)$ ， $P (A + B + C) = P (A) + P (B) + P (C) - P (A B) - P (A C) - P (B C) + P (A B C)$
- 条件概率： $P (A ∣ B) = P (A B) / P (B)$
- 乘法公式： $P (A B) = P (A) P (B)$ ，则称 $A ， B$ 独立
- 全概率公式： $P(A)=\sum_{i=1}^n P(B_i)P(A|B_i)$ ，其中 $B_1,\cdots,B_n互斥且和为样本空间$
- 贝叶斯公式： $P(B_i|A)=P(AB_i)/P(A)=P(B_i)P(A|B_i)/\sum_jP(B_j)P(A|B_j)$

Note：

两两独立 $\neq$ 相互独立，相互独立才满足 $P(A_1\cdots A_n)=P(A_1)\cdots P(A_n)$
若一列事件相互独立，则其中一部分改为对立事件，仍相互独立
- $\Rightarrow$ ， $\forall i_1,\cdots,i_m$ 证 $\overline{A_1}与A_2\cdots A_m$ 相互独立
- $\Leftarrow$ ，取m个求和
为便于理解贝叶斯公式，浅举一个例子：发病率=0.5%,生病->阳性=95%，不生病->阴性=95%，已知为阳性，问他生病的概率是多少
- $P(B_i|A)=\frac{0.5\%\times 95\%}{0.5\%\times95\%+99.5\%\times5\%}=8.7\%$

二、随机变量及其概率分布

随机变量—— $\Omega为随机试验E的样本空间，If\forall \omega\in\Omega$
- $\exist^1 X(\omega)(实数)与\omega对应$ ，称 $X=X(\omega)$ 为随机变量
Note：随机变量 $X$ 的范围本质上即随机事件

一维随机变量

分布函数—— $X$ 为随机变量( $\ variable$ )
- $P\{X\leq x\}\triangleq F(x),-\infty<x<+\infty$
性质:
- $0\leq F(x)\leq 1$
- $F (x)$ 单调不减
- $F (x)$ 右连续，即 $\lim_{x\rightarrow x_0^+}F(x)=F(x_0)$
- $F(-\infty)=0,F(+\infty)=1$
Notes
- $P\{X<x\}=F(x-0)$
- $P\{X=x\}=P\{X\leq x\}-P\{X<x\}=F(x)-F(x-0)$
- $P\{a<X\leq b\}=P\{X\leq b\}-P\{X\leq a\}=F(b)-F(a)$

离散型随机变量即分布律

分布律——设 $X$ 为离散型随机变量，可能取值为 $x_1,\cdots,x_n$ ，对应概率为 $p_1,\cdots,p_n$
- 则列表或 $P\{X=x_i\}=p_i(i=1,\cdots,n,\cdots)$ 称为分布律

二项分布(☆)

n重伯努利试验，试验只有两个可能结果 $A和\overline{A}$ ， $X$ 为 $n$ 次试验， $A$ 出现的次数

二项分布：设 $X$ 为离散型随机变量，若 $X$ 的分布律为 $P(X=k)=C_n^kp^k(1-p)^{n-k}(0<p<1,k=0,1,\cdots,n)$ ，称 $X$ 服从二项分布，记为 $X\sim B(n,p)$

泊松分布(☆)

泊松分布：设 $X$ 为离散型随机变量，若 $x$ 的分布律为 $P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}(\lambda > 0,k=1,2,\cdots)$ ，称 $X$ 服从泊松分布，记为 $X\sim P(\lambda)$

超几何分布

超几何分布：设 $X$ 为离散型随机变量，产品共 $N$ 个，废品 $M$ 个，取 $n$ 个恰好废品个数为 $X$ ，若 $X$ 的分布律为 $P(X=m)=\frac{C_M^mC_{N-M}^{n-m}}{C_N^n}$ ，称 $X$ 服从超几何分布

负二项分布

$X$ 表示直至 $A$ 出现r次停止，试验结果仅两种 $A$ 和 $\overline{A}$ ，

负二项分布：设 $X$ 为离散型随机变量，若 $X$ 的分布律为 $P(X=k)=C_{r+k-1}^kp^r(1-p)^k(k=0,1,2,\cdots)$ ，称 $X$ 服从负二项分布，记为 $X\sim NB(r,p)$

几何分布

$X$ 表示首次出现 $A$ 试验的次数，试验结果仅两种 $A$ 和 $\overline{A}$

几何分布：设 $X$ 为离散型随机变量，若 $X$ 的分布律为 $P(X=k)=p(1-p)^{k-1}(k=1,2,\cdots)$ ，称 $X$ 服从几何分布，记为 $X\sim G(p)$
显然是 $r = 1$ 时的负二项分布

Note：

泊松分布可作为二项分布的极限得到，其中 $n$ 很大， $p$ 很小，而 $np=\lambda$ 不太大
- $P(X=k)=C_n^kp^k(1-p)^{n-k}=\frac{n(n-1)\cdots(n-k+1)}{k!}\frac{n^kp^k}{n^k}(1-\frac{1}{n}np)^{n\frac{n-k}{n}}\rightarrow \frac{1}{k!}\lambda^ke^{-\lambda}$

连续性随机变量及密度函数

密度函数—— $\Omega$ 为随机试验 $E$ 的样本空间， $X$ 为 $\Omega$ 上的随机变量
- $F(x)=P\{X\leq x\}$ ，若 $\exist f(x)\geq 0,使\int_{-\infty}^xf(t)dt=F(x)$ ， $f (x)$ 称为 $X$ 的密度函数

均匀分布(☆)

均匀分布：设 $X$ 为连续型随机变量，若 $X$ 密度函数 $f(x)=\begin{cases}\frac{1}{b-a}, & a<x<b \\ 0, &其他\end{cases}$ ，称 $X$ 服从 $(a, b)$ 的均匀分布，记为 $X\sim U(a,b)$
分布函数： $F(x)=\begin{cases}0,&x <a \\ \frac{x-a}{b-a},& a<x<b \\ 1, &x\geq b\end{cases}$

指数分布(☆)

指数分布：设 $X$ 为连续型随机变量，若 $X$ 密度函数 $f(x)=\begin{cases}\lambda e^{-\lambda x}, &x > 0 \\ 0, & x \leq 0 \end{cases}$ ，称 $X$ 服从参数为 $\lambda$ 的指数分布，记为 $X\sim E(\lambda)$
分布函数： $F(x)=\begin{cases}0, &x <0 \\1-e^{-\lambda x}, &x\geq 0\end{cases}$

正态分布(☆☆)

正态分布：设 $X$ 为连续型随机变量，若 $X$ 密度函数 $f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$ ，称 $X$ 服从参数为 $\mu,\sigma^2$ 的正态分布：记为== $X\sim N(\mu,\sigma^2)$ ==
标准正态分布： $\mu = 0, \sigma = 1, X\sim N(0,1)$ ，此时密度函数 $f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}$ ，分布函数为 $\Phi(x)$ ，查表
- $\Phi(0) = \frac{1}{2}$
- $\Phi(-a) = 1 - \Phi(a)$

Note：

$X\sim N(\mu,\sigma^2)$ ，则 $F(x)=\Phi(\frac{x-\mu}{\sigma})$
$X\sim N(\mu,\sigma^2)$ ，则 $P\{a<x\leq b\}=F(b)-F(a)=\Phi(\frac{b-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma})$
$X\sim N(\mu,\sigma^2)$ ，则 $\frac{X-\mu}{\sigma}\sim N(0, 1)$

多维随机变量

$\ r.v.$ —— $E$ 为随机试验， $\Omega$ 为样本空间
- 若 $\forall\omega\in\Omega$ ， $\exist^1$ 一对实数 $(X, Y)$ 与 $\omega$ 对应，称 $(X, Y)$ 为 $2-dim\ r.v.$
分布函数—— $(X,Y)为2-dim\ r. v.$
- $\forall x,y\in R, P\{X\leq x,Y\leq y\}=\triangleq F(x,y)$ ，为 $(X, Y)$ 的联合分布函数
- $P\{X\leq x\}\triangleq F_X(x)$ —— $X$ 的边际分布函数
- $P\{Y\leq y\}\triangleq F_Y(y)$ —— $Y$ 的边际分布函数

离散型随机变量

联合分布率和边缘分布律同理于一维随机变量

连续型随机变量

$\ r.v.$ ，联合分布函数为 $F(x,y)=P\{X\leq x,Y\leq y\}$
- $if\ \exist f(x,y)\geq 0,使\int_{-\infty}^xdx\int_{-\infty}^yf(x,y)dy=F(x,y)$ ，称 $f (x, y)$ 为联合密度函数
- $\int_{-\infty}^{+\infty}f(x,y)dy\triangleq=f_X(x)$ ，为 $X$ 边缘密度函数
- $\int_{-\infty}^{+\infty}f(x,y)dx\triangleq=f_Y(y)$ ，为 $Y$ 边缘密度函数

均匀分布

均匀分布： $D$ 为 $x o y$ 平面内有限区域，其面积为 $A$ ，若 $2 - d i m$ 连续型随机变量 $(X, Y)$ 的联合密度函数为 $f(x,y)=\begin{cases}\frac{1}{A}, &(x,y)\in D \\ 0, &(x,y)\notin D\end{cases}$ ，称 $(X, Y)$ 在 $D$ 上服从均匀分布，记为== $(X,Y)\sim U(D)$ ==

正态分布

正态分布：设 $(X, Y)$ 为 $2 - d i m$ 连续型随机变量，若 $(X, Y)$ 的联合密度函数为 $f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}\{\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{x-\mu_1}{\sigma_1}\frac{x-\mu_2}{\sigma_2}+\frac{(x-\mu_2)^2}{\sigma_2^2}\}}$ ，称 $(X, Y)$ 服从以 $\mu_1,\mu_2,\sigma_1^2,\sigma_2^2\rho$ 为参数的正态分布，记为== $(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$ ==
设 $(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$ ，则 $X\sim N(\mu_1,\sigma_1^2)，Y\sim N(\mu_2,\sigma_2^2)$

条件分布

条件分布率： $设 (X, Y) 为 2 - d i m$ 离散型随机变量，联合分布率为

	$y_1$	$y_2$	$\cdots$	$y_n$	$P_{i·}$
$x_1$	$P_{11}$	$P_{12}$	$\cdots$	$P_{1n}$	$P_{1·}$
$x_2$	$P_{21}$	$P_{22}$	$\cdots$	$P_{2n}$	$P_{2·}$
$\vdots$	$\vdots$	$\vdots$	$\vdots$	$\vdots$	$\vdots$
$x_m$	$P_{m1}$	$P_{m2}$	$\cdots$	$P_{mn}$	$P_{m·}$
$P_{·j}$	$P_{·1}$	$P_{·2}$	$\cdots$	$P_{·n}$	$1$

在 ${X=x_i\}$ 的条件下， ${Y=y_j\}$ 的条件分布率为 $P\{Y=y_j|X=x_i\}=\frac{P\{X=x_i,Y=y_j\}}{P\{X=x_i\}}=\frac{p_{ij}}{p_{i·}}$
在 ${Y=y_j\}$ 的条件下， ${X=x_i\}$ 的条件分布率为 $P\{X=x_i|Y=y_j\}=\frac{P\{X=x_i,Y=y_j\}}{P\{Y=y_j\}}=\frac{p_{ij}}{p_{·j}}$

条件密度函数： $设 (X, Y) 为 2 - d i m$ 连续型随机变量，其联合密度函数为 $f (x, y)$ ，边缘函数为 $f_X(x),f_Y(y)$
- 在 $X = x$ 的条件下， $Y$ 的条件密度函数为 $f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)}$
- 在 $Y = y$ 的条件下， $X$ 的条件密度函数为 $f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}$

随机变量的独立性

独立： $(X, Y)$ 为二维随机变量， $If\ F(x,y)=F_X(x)F_Y(y)$ ，称 $X, Y$ 独立
等价条件
- 离散型随机变量， $P_{ij}=P_{i·}\times P_{·j}$
- 连续性随机变量， $f(x,y)=f_X(x)f_Y(y)$
若连续型随机向量 $X_1,X_2,\cdots,X_n$ 的概率密度函数 $f(x_1,\cdots,x_n)$ 可表为 $n$ 个函数 $g_1,\cdots,g_n$ 之积，其中 $g_i$ 只依赖于 $x_i$ ，即
- $f(x_1,\cdots,x_n)=g_1(x_1)\cdots g_n(x_n)$ ，则 $X_1,\cdots,X_n$ 相互独立，且 $X_i$ 的边缘密度函数 $f_i(x_i)$ 与 $g_i(x_i)$ 只差一个常数因子。

随机变量函数的概率分布

$X\sim B(m,p)，Y\sim B(n,p)$ ，且 $X, Y$ 独立，则 $X+Y\sim B(m+n,p)$
$X\sim P(\lambda)，Y\sim P(l)$ ，且 $X, Y$ 独立，则 $X+Y\sim P(\lambda+l)$
作出 $f (x, y)$ 的密度函数的图像，并在所求函数的条件下，计算二重积分。
$\min\{X,Y\}\Leftrightarrow >$
$\max{X,Y}\Leftrightarrow \leq $
设 $X$ 有密度函数 $f (x)$ ，设 $Y = g (x)$ ，若 $g (x)$ 单调，则有反函数 $X = h (Y) ，$ 那么 $P(Y\leq y)=P(g(X)\leq y)=P(X\leq h(y))$ ，进而求导得， $Y$ 的密度函数 $l (y) = f (h (y)) ∣ h^{'} (y)$ 。若不严格单调，则 $l(y)=\frac{1}{2}y^{-1/2}[f(\sqrt{y})+f(-\sqrt{y})]$
扩展 $l(y_1,\cdots,y_n)=f(h_1(y_1,\cdots y_n),\cdots,h_n(y_1,\cdots,y_n))|J(y_1,\cdots,y_n)|$
随机变量和 $Y=X_1+X_2$ 的密度函数： $l(y)=\int_{-\infty}^{+\infty}f(x,y-x)dx$
随机变量商 $Y=X_2/X_1,X_1只取正值$ 的密度函数： $l(y)=\int_0^{+\infty}x_1f(x_1,x_1y)dx_1$
统一方法，改写+积分。

三、随机变量的数字特征

数学期望

数学期望（不一定存在）：
- $EX=\sum_{i=1}^\infty x_ip_i$
- $EX\triangleq \int_{-\infty}^{+\infty}xf(x)dx$
常见的数学期望
- $X\sim B(n,p)=> EX=np$
- $X\sim P(\lambda)=>EX=\lambda$
- $X\sim U(a,b)=>EX=\frac{a+b}{2}$
- $X\sim E(\lambda)=>EX=\frac{1}{\lambda}$
- $X\sim N(\mu,\sigma^2)=>EX=\mu$
随机变量函数的数学期望
- $EY\triangleq\sum_{i=1}^\infty \phi(x_i)p_i$
- $EY\triangleq\int_{-\infty}^{+\infty}\phi(x)f(x)dx$
- $EZ\triangleq\sum_{i=1}^m\sum_{j=1}^n\phi(x_i,y_j)p_{ij}$
- $EZ\triangleq\int_{-\infty}^{+\infty}dx\int_{-\infty}^{+\infty}\phi(x,y)f(x,y)dy$
性质
- $E (C) = C$
- $E (k X) = k E (X)$
- $E (X + Y) = E (X) + E (Y)$
- 若 $X, Y$ 独立，则 $E (X Y) = E (X) E (Y)$
条件期望
- $E(Y|x)=\int_{-\infty}^{+\infty}yf(y|x)dy$
- 二维正态分布，在给定 $X = x$ 时， $Y$ 的条件分布为正态分布 $N(b+\rho\sigma_2\sigma_1^{-1}(x-a),\sigma_2^2(1-\rho^2))$ 。
- $E (Y) = E [E (Y ∣ X)]$

方差与矩

方差： $D(X)\triangleq E(X-E(X))^2=E(X^2)-(E(X))^2$
常见的方差
- $X\sim B(n,p), DX = np(1-p)$
- $X\sim P(\lambda),DX=\lambda$
- $X\sim U(a,b),DX=\frac{(b-a)^2}{12}$
- $X\sim E(\lambda),DX=\frac{1}{\lambda^2}$
- $X\sim N(\mu,\sigma^2),DX=\sigma^2$
方差的性质
- $D (C) = 0$
- $D(kX)=k^2D(X)$
- 若 $X, Y$ 独立，则 $D (X + Y) = D (X) + D (Y)$
矩：设 $X$ 为随机变量， $c$ 为常熟， $k$ 为正整数，则量 $E[(X-c)^k]$ 称为 $X$ 关于 $c$ 点的 $k$ 阶矩
- $c = 0$ ， $a_k=E(X^k)$ ，称为 $X$ 的 $k$ 阶原点矩
- $c = E (X)$ ，这时 $\mu_k=E(X-EX)^k$ 称为 $X$ 的 $k$ 阶中心矩
- 偏度系数： $\beta_1=\mu_3/\mu_2^{3/2}$ (可忽略)
- 峰度系数： $\beta_2=\mu_4/\mu_2^2$ (可忽略)

协方差与相关系数

协方差

协方差： $(X, Y)$ 为 $2-dim\ r.v.$ ，称 $E (X - E X) (Y - E Y)$ 为 $X, Y$ 的协方差，记为 $C o v (X, Y)$
$C o v (X, Y) = E (X Y) - E (X) E (Y)$
- 若 $X, Y$ 独立， $E(XY)=E(X)E(Y)\Rightarrow Cov(X,Y)=0$
- $C o v (X, X) = D X$
协方差的性质
- $C o v (X, Y) = C o c (Y, X)$
- $C o v (a X, b Y) = a b C o v (X, Y)$
- $Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)$
- $D (X + Y) = D (X) + D (Y) + 2 C o v (X, Y)$

大数定理和中心极限定理

车比雪夫不等式与大数定理

车比雪夫不等式：
- $X$ 是随机变量， $\exist EX,DX$ ， $\forall \epsilon>0,则P\{|X-EX|<\epsilon\}\geq 1-\frac{DX}{\epsilon^2}$
- 即 $P\{|X-EX|\geq \epsilon\}\leq \frac{DX}{\epsilon^2}$
大数定律
- 车比雪夫： $X_1,\cdots,X_n相互独立，\exist c>0，使得DX_i\leq c$
  - 则 $\forall\epsilon>0,有\lim_{n\rightarrow\infty}P\{|\frac{1}{n}\sum_{i=1}^nX_i-\frac{1}{n}\sum_{i=1}^nEX_i|<\epsilon\}=1$
- 独立同分布： $X_1,\cdots,X_n独立同分布，\exist EX_i=\mu，\exist DX_i=\sigma^2$
  - 则 $\forall\epsilon>0,有\lim_{n\rightarrow\infty}P\{|\frac{1}{n}\sum_{i=1}^nX_i-\mu|<\epsilon\}=1$

中心极限定理

$L e v y - L i n d b e r g$ ：若 $X_1,\cdots,X_n$ 独立同分布， $\exist EX_i=\mu,DX_i=\sigma^2$
- 则 $\sum_{i=1}^nX_i\sim N(n\mu,n\sigma^2)$
$L a p l a c e$ ：设 $X_1,\cdots,X_n$ 独立同分布，于 $X_i\sim B(1,p)$
- 则 $\sum_{i=1}^nX_i\sim N(np,np(1-p))$