2021年秋季《概率论与数理统计》学习笔记

最新推荐文章于 2024-07-19 16:29:56 发布

rd142857

最新推荐文章于 2024-07-19 16:29:56 发布

阅读量420

点赞数 2

分类专栏：概率论文章标签：概率论 1024程序员节

本文链接：https://blog.csdn.net/rd142857/article/details/120277782

版权

概率论专栏收录该内容

6 篇文章 0 订阅

订阅专栏

多维随机变量及之后内容、概念理解和误区澄清性质笔记可参考本专栏其他博客。

20211002更新至2.4连续型随机变量

“概率的概率”

20210930更新

几何分布无记忆性证明
泊松分布直观理解

20210925更新

习题 $1.4$ 第 $8$ 题（ $\rm Bayes$ 公式的应用）
习题 $1.5$ 第 $2$ 题

20210920更新

$\rm Bayes$ 公式的几何理解

20210913更新

$\rm Poincar\acute e$ 公式证明
例 $1.3.5$ 思考题

事件与概率

随机事件

样本空间：随机试验的所有可能结果

随机事件：某些可能结果组成的集合

常用证明技巧

$A\subset B, B\subset A \Rightarrow A=B \\$

$\overline{\overline{A}}=A$

样本空间

随机现象

在一定条件下并不总出现相同的结果

随机试验（ $E$ ）

对随机现象进行的实验和观察

特征

结果具有随机性
可以重复进行

样本点（ $\omega$ ）

随机试验的每一个可能结果

样本空间（ $\Omega$ ）

随机试验的所有样本点组成的集合

随机事件

定义

随机试验的某些可能的结果组成的集合，即样本空间 $\Omega$ 的一个子集

简称为事件，通常用大写字母表示

事件发生：某次随机试验出现的结果包含在随机事件中，即 $\omega \in A$

$A\subset B$ ： $A$ 发生必然导致 $B$ 发生

特殊事件

基本事件：只包含一个样本点
必然事件（ $\Omega$ ）：包含全部样本点，即样本空间
不可能事件（ $\emptyset$ ）：不含有任何样本点的事件

关系

$A\setminus B = A\cap \overline{B}$

$A\triangle B = A\setminus B + B\setminus A$

对偶公式

$\begin{aligned} \overline{A\cup B} &= \overline{A}\cap \overline{B} \\ \overline{A\cap B} &= \overline{A}\cup \overline{B} \end{aligned}$

事件域（ $\mathcal{F}$ ）

$\mathcal{F}$ 是由 $\Omega$ 的部分子集组成的集合类，若 $\mathcal{F}$ 满足：

$\Omega\in \mathcal{F}$ ;
$A\in \mathcal{F}$ 蕴含 $\overline{A}\in \mathcal{F}$ ;
对任意的 $n\geq 1$ ， $A_n\in \mathcal{F}$ 蕴含 $\bigcup_{i=1}^n\in \mathcal{F}$ ，

则称 $\mathcal{F}$ 为样本空间 $\Omega$ 上的事件域，简称为事件域。

概率

定义

设 $P(\cdot)$ 是定义在 $\mathcal{F}$ 上的实值函数，如果其满足下面三条公理：

非负性： $P(A)\ge 0$
正则性： $P(\Omega) = 1$
可列可加性：若 $A_1,A_2,\cdots, A_n$ 互不相容，则
$P(\sum_{n=1}^\infin A_n) = \sum_{n=1}^\infin P(A_n)$

则称 $P(\cdot)$ 为概率测度或概率。

称三元总体 $(\Omega,\mathcal{F},P)$ 为概率空间。

性质

可减性：
$P(A\setminus B) = P(A)-P(B)$
加法公式：
$P(A\cup B) = P(A)+P(B)-P(A\cap B)$

$P(A\cup B\cup C) = P(A)+P(B)+P(C)-P(A\cap B)-P(A\cap C)-P(B\cap C)+P(A\cap B \cap C)$

可推广得到
$\begin{aligned} P(\bigcup_{k=1}^n A_k) =& \sum_{k=1}^n P(A_k)-\sum_{i<j}P(A_iA_j) + \sum_{i<j<k}P(A_i A_j A_k) \\ &+\cdots + (-1)^{n-1}P(A_1 A_2\cdots A_n) \end{aligned}$
即庞加莱（ $\rm Poincar\acute{e}$ ）公式，可由数学归纳法证明。
准备如下：
$\begin{aligned} A\cup B\cup C&=(A\cup B)\cup C \\ (A\cup B) C&=(AC)\cup(BC) \\ (AC)\cap (BC) &= ABC \end{aligned}$
下面用数学归纳法证明：
1. 当 $n = 1$ 时， $P(A_1)=P(A_1)$ 成立；
2. 假设 $n=k_0$ 时，
  $\begin{aligned} P(\bigcup_{k=1}^{k_0} A_k) =& \sum_{k=1}^{k_0} P(A_k)-\sum_{i<j}P(A_iA_j) + \sum_{i<j<k}P(A_i A_j A_k) \\ &+\cdots + (-1)^{k_0-1}P(A_1 A_2\cdots A_{k_0}) \end{aligned}$
  则当 $n=k_0+1$ 时，
  $\begin{aligned} P(\bigcup_{k=1}^{k_0+1} A_k) =& P((\bigcup_{k=1}^{k_0} A_k)\bigcup A_{k_0+1})\\ =& P(\bigcup_{k=1}^{k_0} A_k)+P(A_{k_0+1})-P((\bigcup_{k=1}^{k_0} A_k)A_{k_0+1}) \\ =& \sum_{k=1}^{k_0} P(A_k)-\sum_{i<j}P(A_iA_j)+\cdots + (-1)^{k_0-1}P(A_1 A_2\cdots A_{k_0}) \\ &+P(A_{k_0+1})-P(\bigcup_{k=1}^{k_0} (A_kA_{k_0+1})) \\ \end{aligned}$
  至此完成了一次项的求解。
  
  记 $P(\bigcup_{k=1}^{k_0} (A_kA_{k_0+1}))=P$ ，则
  $\begin{aligned} P =& \sum_{k=1}^{k_0}P(A_kA_{k_0+1})-\sum_{i<j}P(A_iA_{k_0+1}A_jA_{k_0+1})\\ &+\cdots+ (-1)^{k_0-1}(A_1 A_{k_0+1}\cdots A_{k_0}A_{k_0+1}) \\ =& \sum_{k=1}^{k_0}P(A_kA_{k_0+1})-\sum_{i<j}P(A_iA_jA_{k_0+1})\\ &+\cdots+ (-1)^{k_0-1}(A_1\cdots A_{k_0}A_{k_0+1}) \\ \end{aligned}$
  将 $P$ 代回原式，
  $\begin{aligned} P(\bigcup_{k=1}^{k_0+1} A_k) =& \sum_{k=1}^{k_0+1} P(A_k) - \sum_{i<j}P(A_iA_j)+(-1)^{k_0-1}P(A_1 A_2\cdots A_{k_0}) \\ &-(\sum_{i<j}P(A_iA_jA_{k_0+1}) +\cdots+ (-1)^{k_0-1}(A_1\cdots A_{k_0}A_{k_0+1})) \\ =&\sum_{k=1}^{k_0+1} P(A_k)-\sum_{i<j}P(A_iA_j) + \sum_{i<j<k}P(A_i A_j A_k) \\ &+\cdots + (-1)^{k_0}P(A_1 A_2\cdots A_{k_0+1}) \end{aligned}$
  得证。
若记
$S_m = \sum_{1\leq i_1<\cdots<i_m\leq n}P(A_{i_1}\cdots A_{i_m})$
则 $\rm Poincar\acute{e}$ 公式可改写为
$P(\bigcup_{k=1}^n A_k) = \sum_{m=1}^n (-1)^{m-1} S_m$

计算

常用计算技巧

$1-P(\overline A)$

确定概率的方法

古典方法

$\frac{|A|}{|\Omega|}$

适用条件

$\Omega$ 为有限集
每个基本事件的发生是等可能的

由上述条件易得，在抛硬币、摸球等模型中常用古典方法确定概率。

例题

（例 $1.3.5$ ）口袋中有 $n - 1$ 个黑球、 $1$ 个白球，每次从口袋中随机地摸出一球，并换入一只黑球。求取第 $k$ 次时取到的球是黑球的概率。

解设 $A_k$ 表示事件“取第 $k$ 次时取到的球是黑球”， $k=1,2,\cdots$ . 则 $\overline {A_{k}}$ 表示事件“取第 $k$ 次时取到的球是白球”。易得 $P(A_1) = \frac{n-1}{n}$ . 由于一旦取到白球，口袋中所有的球都会变为黑色，所以取到白球的条件是之前每次都摸到黑球，即
$\overline{A_k}=A_1 A_2\cdots A_{k-1}\overline{A_k}, k = 1,2,\cdots$
于是
$\begin{aligned} P(A_{k}) &= 1-P(\overline{A_{k}}) \\ &= 1-P(A_1 A_2\cdots A_{k-1}\overline{A_k}) \\ &= 1-(\frac{n-1}{n})^{k-1}\cdot \frac{1}{n}, \quad k=2,3,\cdots \end{aligned}$

口袋中有两个白球，每次从口袋中随机地摸出一球，并换入一只黑球。求取第 $k$ 次时取到的球是黑球的概率。

解仿照例题做法，设 $A_k$ 表示事件“取第 $k$ 次时取到的球是黑球”， $k=1,2,\cdots$ ，则 $\overline {A_{k}}$ 表示事件“取第 $k$ 次时取到的球是白球”。

易得 $P(\overline{A_1}) = 1，P(\overline{A_2}) = \frac{1}{2}$ ，自此起回归到 $n = 2$ 的例题模型，解得
$P(A_k)= \begin{cases} 1, & k=1 \\ 1-\frac{1}{2^{k-1}}, & k=2,3,\cdots \end{cases}$

一枚均匀的硬币，甲掷 $n + 1$ 次，乙掷 $n$ 次。求甲掷出的正面数比乙掷出的正面数多的概率。

解

	甲	乙
正	$A$	$B$
反	$C$	$D$

$\begin{aligned} P(A>B) &= P(n+1-C>n-D) \\ &= P(C-1<D) \\ &= P(C\leq D) \\ &= 1-P(C>D) \\ &=1-P(A> B) \end{aligned}$

故 $P (A > B) = 0.5$ .

频率方法

$\frac{n(A)}{n}$

几何方法

$\frac{L(A)}{L(\Omega)}$

其中， $L (A)$ 表示 $A$ 的度量（距离函数）。

适用条件

$\Omega$ 是 $n$ 维空间中的有界区域， $L(\Omega)>0$ .
每个样本点落在某个子区域的概率与该区域的度量大小成正比，与区域的形状和位置无关。

例题

（例 $1.3.13$ ）

其中，
$\Omega = \{(x,y):0\leq x\leq 60,0\leq y\leq 60\}$

$\{(x,y)\in \Omega:|x-y|\leq 20\}$

通过本题我们发现，零概率事件未必是不可能事件，例如记 $\{(x,y)\in \Omega:x-y=20\}$ ，由于 $L (B) = 0$ ，所以 $P (B) = 0$ ，但显然 $KaTeX parse error: Undefined control sequence: \O at position 6: B\neq\̲O̲$ ，具体原理将在后续讨论。
（例 $1.3.15$ ） $\rm Buffon$ 投针问题

向画有距离维 $d$ 的一组平行线的平面任意投一长为 $l (l < d)$ 的针，求针与任一平行线相交的概率。

记 $x$ 表示针的中点到最近的平行线的距离， $\theta$ 表示针与此平行线的夹角。

于是，针的位置可以表示为
$\Omega = \{(x,\theta):0\leq x\leq \frac{d}{2},0\leq \theta< \pi\}.$
令 $A$ 表示事件“针与任一平行线相交”，则
$A=\{(x,\theta):0\leq x\leq \frac{l}{2}\rm sin\theta, 0\leq \theta< \pi\}.$
可得
$\frac{L(A)}{L(\Omega)}=\frac{\int_0^{\pi}\frac{l}2 \rm sin\theta\rm d\theta}{\frac{d}2 \pi} = \frac{2l}{\pi d}.$

常见概率模型

不返回抽样（超几何模型）

设有 $N$ 个产品，其中 $M$ 个不合格。从中不返回任取 $n$ 个，则此 $n$ 个中有 $m$ 个不合格的概率为
$\frac{C_M^m\cdot C_{N-M}^{n-m}}{C_N^n}$

返回抽样

设有 $N$ 个产品，其中 $M$ 个不合格。从中有返回任取 $n$ 个，则此 $n$ 个中有 $m$ 个不合格的概率为
$C_n^m \frac{M^m(N-M)^{n-m}}{N^n}$

盒子模型

$n$ 个不同的球放进 $N$ 个不同的盒子里，每个盒子放球数不限，则恰有 $n$ 个盒子各有一球的概率为
$\frac{A_N^n}{N^n} = \frac{N!}{N^n(N-n)!}$

配对模型

$n$ 个人、 $n$ 顶帽子，每人任取 $1$ 顶，至少一个人拿对自己帽子的概率

记 $A_k=$ “第 $k$ 个人拿对自己帽子”，应用加法公式，
$P(\bigcup_{k=1}^n A_k) = \sum_{k=1}^n (-1)^{k-1}\frac{1}{k!}$

条件概率

定义

设 $(\Omega, \mathcal{F}, P)$ 是给定的概率空间， $B\in \mathcal{F}$ 且满足 $P (B) > 0$ ，对任意的事件 $A\in \mathcal{F}$ ，令
$\triangleq \frac{P(AB)}{P(B)}.$
称 $P (A ∣ B)$ 为在事件 $B$ 发生的条件下，事件 $A$ 发生的条件概率。

注意

$P (A)$ 为事件 $A$ 的无条件概率，也可视为条件概率 $P(A|\Omega)$ 。

定理

条件概率是概率。

在概率空间 $(\Omega, \mathcal{F}, P)$ 中， $B\in \mathcal{F}$ 且 $P (B) > 0$ .定义集函数
$P_B(A)=P(A|B)$
则 $P_B$ 也是定义在 $\mathcal{F}$ 上的概率。于是，

$P(\overline{A}|B) = 1-P(A|B)$
$P(A\cup C|B) = P(A|B)+P(C|B)-P(AC|B)$
$P(A\setminus C|B) = P(A|B)-P(AC|B)$

乘法公式

若 $A,B\in \mathcal{F}$ ，且 $P (A) > 0, P (B) > 0$ ，则
$P (A B) = P (A) P (B ∣ A) = P (B) P (A ∣ B)$
若 $n > 1$ ， $A_1,A_2,\cdots,A_n\in \mathcal{F}$ ，且 $P(A_1 A_2\cdots A_{n-1})>0$ ，则
$P(A_1 A_2\cdots A_n) = P(A_1)P(A_2|A_1)\cdots P(A_n|A_1\cdots A_{n-1})$
- 条件概率版本
  
  若 $B,A_1,A_2,\cdots,A_n\in \mathcal{F}$ ，且 $P(A_1 A_2\cdots A_{n-1})>0$ ，则
  $P(A_1 A_2\cdots A_n|B) = P(A_1|B)P(A_2|A_1B)\cdots P(A_n|A_1\cdots A_{n-1}B)$

全概率公式

对于任意事件 $A$ 和 $B$ ，若 $0 < P (B) < 1$ ，则
$P(A|B)P(B)+P(A|\overline B)P(\overline B)$
对于分割，
$\sum_{k=1}^n P(B_k)P(A|B_k)$
关键在于寻找一组事件来**“分割”样本空间**。
- 条件概率版本
  $\sum_{k=1}^n P(B_k|C)P(A|B_k C)$

贝叶斯( $\rm Bayes$ )公式

内容

设 $B_1,\cdots, B_n$ 为样本空间的一组分割，且 $P(B_k)>0$ …有
$P(B_j|A) = \frac{P(B_j)P(A|B_j)}{\sum_{k=1}^n P(B_k)P(A|B_k)}$
通常， $B_1,\cdots B_n$ 是事件 $A$ 发生的原因。

$P(B_k)$ ：先验概率

$P(B_k|A)$ ：后验概率

条件概率版本
$P(B_j|AC) = \frac{P(B_j|C)P(A|B_j C)}{\sum_{k=1}^n P(B_k|C)P(A|B_kC)}$

几何理解

在这里插入图片描述

例题（ $1.3$ 习题 $8$ ）

解：记事件 $A =$ “选中 $5$ 黑 $5$ 白的罐子”，事件 $B =$ “取出 $2$ 个黑球”，已知 $P(A|B)=\frac{1}{7}$ 。

在这里插入图片描述

独立性

两个事件的独立

定义

$P (A B) = P (A) P (B)$

条件概率版本
$P (A B ∣ C) = P (A ∣ C) P (B ∣ C)$
称为 $A$ 和 $B$ 在 $C$ 发生时条件独立。

注记

对于独立事件， $P (A) = P (A ∣ B), P (B) = P (B ∣ A)$ 。
零概率事件、必然事件与任何事件独立，不可能事件与任何事件独立。

证明：设 $B$ 为任一事件，

当 $P (A) = 0$ 时， $P(AB)=0=0\cdot P(B)=P(A)P(B)$ ，所以 $A 、 B$ 独立；

当 $P (A) = 1$ 时， $P(\overline A)=0$ ，同理 $\overline A$ 和 $B$ 独立，于是 $A 、 B$ 独立。
（ $0 - 1$ 律）若事件 $A$ 与自身独立，则 $P (A) = 0$ 或 $1$

定理

事件 $A$ 与 $B$ 独立 $\Leftrightarrow$ 事件 $\overline A$ 与 $B$ 独立 $\Leftrightarrow$ 事件 $A$ 与 $\overline B$ 独立 $\Leftrightarrow$ 事件 $\overline A$ 与 $\overline B$ 独立。

设有随机事件 $A$ 、 $B$ 和 $C$ ，满足 $P (B C) > 0 .$ 事件 $A$ 和 $B$ 相互独立推不出 $P (A ∣ B C) = P (A ∣ C)$ 。

多个事件的独立

定义

多个事件间的相互独立

称 $n(\ge 2)$ 个事件 $A_1,A_2,\cdots ,A_n\in \mathcal{F}$ 相互独立，若对任意的整数 $m:2\leq m\leq n$ 及任意的 $1\leq i_1<\cdots <i_m\leq n$ ，
$P(A_{i_1}\cap \cdots \cap A_{i_m})=P(A_{i_1})\cdots P(A_{i_m})$
都成立。

$m m$ 独立 $(2\leq m\leq n)$

称 $n(\ge 2)$ 个事件 $A_1,A_2,\cdots ,A_n\in \mathcal{F}$ $m m$ 独立，若对任意 $1\leq i_1<\cdots <i_m\leq n$ ，
$P(A_{i_1}\cap \cdots \cap A_{i_m})=P(A_{i_1})\cdots P(A_{i_m})$
都成立，即任意 $m$ 个互异的事件同时发生的概率等于各自发生概率的乘积。

注记

$n(\ge 2)$ 个事件 $A_1,A_2,\cdots ,A_n\in \mathcal{F}$ 相互独立，当且仅当这 $n$ 个事件两两独立，三三独立， $\cdots$ ， $n n$ 独立。
$n(\ge 2)$ 个事件 $A_1,A_2,\cdots ,A_n\in \mathcal{F}$ 相互独立，当且仅当对任意的整数 $m:2\leq m\leq n$ ，其中的任意 $m$ 个互异的事件都相互独立。

定理

相互独立条件下的 $\rm Poincar\acute{e}$ 公式：
$\begin{aligned} P(\bigcup_{k=1}^n A_k) &= 1-P(\overline{\bigcup_{k=1}^n A_k}) = 1-P(\bigcap_{k=1}^n \overline{A_k}) \\ &= 1-\prod_{k=1}^nP(\overline{A_k})= 1-\prod_{k=1}^n(1-P(A_k)). \\ \end{aligned}$

试验的独立

定义

独立试验

试验 $E_1$ 的任一结果与试验 $E_2$ 的任一结果都是相互独立的事件。

贝努里( $\rm Bernoulli$ )试验

只有两个结果的试验。

称 $n$ 次独立重复的 $\rm Bernoulli$ 试验为 $n$ 重 $\rm Bernoulli$ 试验。

一维随机变量

定义在 $\Omega$ 上实值函数 $X=X(\omega)$ 为随机变量（ $r . v .$ ），如果对任意的实数 $x$ ， $\{\omega\in \Omega:X(\omega)\leq x\}\in \mathcal{F}$ .

通俗地理解，随机变量就是数值化的不同的试验结果。

分布函数

设 $X$ 为随机变量，对任意的实数 $x$ ，称函数 $F(x)=P(X\leq x)$ 为 $x$ 的累积分布函数，即分布函数（ $d . f .$ ）。

通俗地理解，分布函数 $F (x)$ 就是 $X$ 不超过 $x$ 的概率。

性质

单调性
有界性：对于任意实数 $x$ ， $0\leq F(x)\leq 1,F(+\infin) = 1, F(-\infin) = 0$ ，其中 $F(+\infin)\triangleq \lim_{x\rightarrow +\infin}F(x),F(-\infin)\triangleq \lim_{x\rightarrow -\infin}F(x)$ 。
右连续性：对于任意实数 $x$ ， $F (x + 0) = F (x)$ 。

可以理解， $F (x) - F (x - 0)$ = $P (X = x)$ ， $F (x - 0) = P (X < x)$ .

定理

$P(a<X\leq b) = F(b)-F(a)$
$P (X = x) = F (x) - F (x - 0), P (X < x) = F (x - 0)$

于是，
$P(a\leq X\leq b) = F(b)-F(a)+F(a)-F(a-0)=F(b)-F(a-0)$
其余同理。

离散型随机变量

定义

设随机变量 $X$ 的可能取值为有限个或可列个，记为 $x_1,x_2,\cdots$ ，则称 $X$ 是离散型随机变量或 $X$ 具有离散型分布，并称 $p_k=P(X=x_k)$ 为 $X$ 的分布列或概率函数（ $p . f .$ ）。

分布列的性质
- 非负性
- 正则性： $\sum_{k=1}^\infin p_k=1$

分布函数

$\sum_{k:x_k\leq x} p_k$

（约定 $KaTeX parse error: Undefined control sequence: \O at position 11: \sum_{k\in\̲O̲} p_k=0$ ）。

性质

单调不降的阶梯函数
间断点为 $X$ 的可能取值点，并在间断点处右连续，且在间断点处的跳跃高度即为 $p(x_k)$ 。

特殊分布

二项分布

设 $X$ 表示 $n$ 重贝努利试验中成功的次数，
$P(X=k) = C_n^k p^k (1-p)^{n-k}$
记为 $X\sim b(n,p)$ 。

特别地，当 $n = 1$ 时，称 $b (1, p)$ 为两点分布或 $\rm 0-1$ 分布。

泊松分布

$P(X=k)=\frac{\lambda^k}{k!} e^{-\lambda}$

称 $X$ 为服从参数为 $\lambda$ 的泊松分布，记为 $X\sim P(\lambda)$ .

泊松定理

设 $\lim_{n\rightarrow +\infin} np_n=\lambda$ ，则对固定的正整数 $k$ ，
$\lim_{n\rightarrow +\infin} C_n^kp_n^k(1-p)^{n-k}=\frac{\lambda^k}{k!} e^{-\lambda}$
当 $n$ 充分大、 $p$ 很小、 $n p$ 适中（通常要求 $0.1\leq np\leq 10$ ）时，可作近似计算
$C_n^kp_n^k(1-p)^{n-k}\approx \frac{np^k}{k!}e^{-np}.$
这个链接讲得很好

$\lambda$ 是二项分布 $(n, p)$ 的数学期望，即 $\lambda=np$ ，近似于样本均值。泊松分布可近似理解为 $n$ 趋向于正无穷的二项分布。

通常用来刻画稀有事件发生的次数或个数（当二项分布的 $p$ 较小时泊松分布和二项分布较为接近），和社会生活中各中服务的需求量。

超几何分布

$\frac{C_M^k\cdot C_{N-M}^{n-k}}{C_N^n}$

称为 $X$ 服从参数为 $(n, N, M)$ 的超几何分布，记为 $X\sim h(n,N,M)$ .

对应不返回抽样模型。

固定 $n, k$ ，当 $N\rightarrow +\infin$ 且 $M/N\rightarrow p$ 时，
$\frac{C_M^k\cdot C_{N-M}^{n-k}}{C_N^n}\rightarrow C_n^k p^k(1-p)^{n-k}.$

几何分布

设 $X$ 表示 $n$ 重贝努利试验中首次成功时的总试验次数，
$P(X=k) = p(1-p)^{k-1}$
记为 $X\sim Ge(p)$ 。

无记忆性

设 $X\sim Ge(p)$ ，则
$P (X > m + n ∣ X > m) = P (x > n)$
对任意 $n\in N^+$ 成立。即：在一系列贝努利试验中，已知在前 $m$ 次未成功的条件下，接下来 $n$ 次试验仍未成功的概率与已经失败的次数 $m$ 无关。

先证 $P(X>m) = (1-p)^m$ .

直观上理解， $P (X > m)$ 表示前 $m$ 次不成功，第 $(m+1)\sim \infin$ 次可能成功的概率之和，即前 $m$ 不成功的概率 $1-p)^m$ 。

在此基础上计算，
$\begin{aligned} P(X>m) &= \sum_{k=m+1}^\infin P(X=k) = p(1-p)^m+p(1-p)^{m+1}\cdots \\ &= p\sum_{k=m}^\infin (1-p)^k = p\cdot \frac{(1-p)^m}{p} = (1-p)^m \end{aligned}$
由条件概率公式
$\frac{P(AB)}{P(B)},$

$\begin{aligned} P(X>m+n|X>m) &= \frac{P(X>m+n且X>m)}{P(X>m)} \\ &=\frac{P(X>m+n)}{P(X>m)} \\ &=\frac{(1-p)^{m+n}}{(1-p)^m} \\ &= (1-p)^n = P(X>n). \end{aligned}$

负二项分布/ $\rm Pascal$ 分布

设 $X$ 表示贝努利试验中第 $r$ 次成功时的总试验次数，
$P(X=k) = C_{k-1}^{r-1}p^{r}(1-p)^{k-r}$
记为 $X\sim Nb(r, p)$ .

例题（ $\rm Banach$ 火柴问题）

两盒火柴各有 $n$ 根，分别放在左右两个衣袋里。每次使用时，随机地从其中一盒抽出一根。试求首次发现其中一盒火柴已用完，而另一盒中剩下 $k(0\leq k\leq n)$ 根火柴的概率。

记事件 $A$ =“取左边口袋中的火柴”，则 $P(A)=\frac{1}{2}$ 。首次发现左盒空，即 $A$ 第 $n + 1$ 次发生，于是记 $X$ 为 $A$ 发生 $n + 1$ 次时的试验次数， $X\sim Nb(n+1, \frac{1}{2})$ .

记事件 $B$ =“首次发现左边火柴已用完，而右边剩下 $k(0\leq k\leq n)$ 根火柴”，此时 $A$ 发生 $n + 1$ 次， $\overline A$ 发生 $n - k$ 次，一共发生了 $n + 1 + n - k = 2 n - k + 1$ 次随机试验。则 $B=\{X=2n-k+1\}$ .于是
$\begin{aligned} P(B) &= C_{2n-k+1-1}^{n+1-1}(\frac{1}{2})^{n+1}(1-\frac{1}{2})^{2n-k+1-(n+1)} \\ &= C_{2n-k}^{n}(\frac{1}{2})^{2n-k+1} \end{aligned}$
由对称性，"首次发现右边火柴已用完，而左边剩下 $k(0\leq k\leq n)$ 根火柴"的概率与 $P (B)$ 相等，于是题目要求答案为 $C_{2n-k}^{n}(\frac{1}{2})^{2n-k}$ .

连续型随机变量

定义

设随机变量 $X$ 的分布函数为 $F (x)$ ，若存在非负函数 $p (x)$ ，使得对任意的实数 $x$ ，
$\int_{-\infin}^x p(t){\rm d}t,$
则称 $X$ 为连续型随机变量或具有连续型分布；称 $p (x)$ 为概率密度函数，简称为密度函数（ $\rm p.d.f.$ ）.

注记

连续函数
$P (X = a) = F (a) - F (a - 0) = 0$

概率为 $0$ 的事件可能会发生

点概率： $1/+\infin$
若 $x$ 是 $F$ 的可导点，则 $\frac{{\rm d}F}{{\rm d}x}(x)$ .若 $x$ 是 $F$ 的不可导点， $p(x)\triangleq 0$ ，但理论上可以为任意实数，所以概率密度函数是不唯一的。
概率密度函数不是概率，而反映 $X$ 在 $x$ 附近取值可能性的大小，
$P(X\in(x-\Delta x/2, x+\Delta x/2)) = \int_{x-\Delta x/2}^{x+\Delta x/2} p(t){\rm d}t \approx p(x)\Delta x$

容易发现，
$P(X\in D) = \int_D p(x){\rm d}x,$
即一块面积。

事实上，概率密度函数是概率的概率，具有实际意义的 $p(x_0)$ 其实是 $p(x_0\leq x\leq x_0+\Delta x),\Delta x\rightarrow 0$ ，即一个人为选取的极限。

如果使用高度（ $y$ 方向上的值）表示概率，那么对每个 $x$ 取极限，每个 $y$ 都将趋向于零，我们只能得到一条水平线，所以使用面积表示概率。

具体可以参考3b1b

性质

非负性
正则性
$\int_{-\infin}^{+\infin}p(x){\rm d}x=1$

定理

设 $p (x)$ 为偶函数，即对任意的实数 $x$ ， $p (x) = - p (x)$ .于是， $\forall a\in R^+$ ，
$\frac{1}{2}-\int_0^a p(x){\rm d}x, \quad F(-a)+F(a) = 1.$
特别地，
$\frac{1}{2},P(|X|\leq a) = 2F(a)-1,P(|X|\geq a) = 2(1-F(a))$

从面积的角度出发容易验证

rd142857

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
2021年秋季《概率论与数理统计》学习笔记

欢迎评论指出错误。文章目录事件与概率随机事件==常用证明技巧==样本空间随机现象随机试验（EEE）特征样本点（ω\omegaω）样本空间（Ω\OmegaΩ）分类随机事件定义特殊事件关系对偶公式事件域（F\mathcal{F}F）概率定义性质计算==常用计算技巧==确定概率的方法古典方法适用条件例题频率方法几何方法频率方法几何方法事件与概率随机事件样本空间：随机试验的所有可能结果随机事件：某些可能结果组成的集合常用证明技巧A⊂B,B⊂A⇒A=BA\subset B, B\subset
复制链接

扫一扫