- 概率论与随机过程课程笔记
文章目录
1. 概率空间与分布函数
1.1 概率空间 { Ω , F , P } \{\Omega,\mathscr{F},P\} {Ω,F,P}
1.1.1 样本空间
样本空间
Ω \Omega Ω:随机试验所有可能结果组成的集合
1.1.2 事件域
-
事件域
F \mathscr{F} F: Ω \Omega Ω 中某些子集组成的集合,满足- Ω ∈ F \Omega\in \mathscr{F} Ω∈F(这里 Ω \Omega Ω 看作必然事件)
- 若 A ∈ F A\in \mathscr{F} A∈F,则 A c ∈ F A^c\in\mathscr{F} Ac∈F( A c A^c Ac 是 A A A 的余集)
- 若 A n ∈ F , n = 1 , 2 , . . . A_n\in\mathscr{F},n=1,2,... An∈F,n=1,2,...,则 ⋃ i = 1 ∞ A n ∈ F \bigcup_{i=1}^\infin A_n\in\mathscr{F} ⋃i=1∞An∈F
-
事件域就是样本空间 Ω \Omega Ω 中所有可能事件的集合,是概率的定义域。只要样本空间的某个子集能算概率,就说明它是一个事件,一定在事件域中。以上三条都能算出概率,因此 ∈ F \in\mathscr{F} ∈F
1.1.3 概率
概率
P : F → R + P: \mathscr{F} \to \mathbb{R}^+ P:F→R+,满足非负性
: ∀ A ∈ F , 0 ≤ P ( A ) ≤ 1 \forall A\in \mathscr{F}, \space 0\leq P(A)\leq 1 ∀A∈F, 0≤P(A)≤1规范性
: P ( Ω ) = 1 P(\Omega) = 1 P(Ω)=1可列可加性
:对于 A n ∈ F , n = 1 , 2 , . . . A_n\in\mathscr{F}, n=1,2,... An∈F,n=1,2,... 且两两互不相交,有 P ( ∑ n = 1 ∞ A n ) = ∑ n = 1 ∞ P ( A n ) P(\sum_{n=1}^\infin A_n) = \sum_{n=1}^\infin P(A_n) P(∑n=1∞An)=∑n=1∞P(An)注:集合的 ∑ \sum ∑ 求和代表两层意义,一是说所有集合两两不交,二是说求并集
- 性质
单调性
:设 A , B A,B A,B 是两个事件,若 A ⊂ B A\subset B A⊂B,则有 P ( A ) ≤ P ( B ) P(A) \leq P(B) P(A)≤P(B)加法公式
: P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) P(A\cup B) = P(A) +P(B) - P(AB) P(A∪B)=P(A)+P(B)−P(AB)减法公式
: P ( A − B ) = P ( A ) − P ( A B ) = P ( A B ‾ ) P(A-B) = P(A) - P(AB) = P(A\overline{B}) P(A−B)=P(A)−P(AB)=P(AB)次可加性
:对于 A n ∈ F , n = 1 , 2 , . . . A_n\in\mathscr{F}, n=1,2,... An∈F,n=1,2,...,有 P ( ⋃ n = 1 ∞ A n ) ≤ ∑ n = 1 ∞ P ( A n ) P(\bigcup_{n=1}^\infin A_n) \leq \sum_{n=1}^\infin P(A_n) P(⋃n=1∞An)≤∑n=1∞P(An)逆事件概率公式
: P ( A ‾ ) = 1 − P ( A ) P(\overline{A}) = 1-P(A) P(A)=1−P(A)下连续性
:若 A n ∈ F A_n\in\mathscr{F} An∈F,且 A n ↑ A A_n\uparrow A An↑A(即 A n A_n An 从左端趋近于 A A A,也即 A n A_n An 严格递增收敛到 A A A, ⋃ n A n = A \bigcup_nA_n = A ⋃nAn=A),则 lim n → ∞ P ( A n ) = P ( lim n → ∞ A n ) = P ( A ) \lim_{n\to\infin}P(A_n) = P(\lim_{n\to\infin}A_n) = P(A) n→∞limP(An)=P(n→∞limAn)=P(A)上连续性
:若 A n ∈ F A_n\in\mathscr{F} An∈F,且 A n ↓ A A_n\downarrow A An↓A(即 A n A_n An 从右端趋近于 A A A,也即 A n A_n An 严格递减收敛到 A A A, ⋂ n A n = A \bigcap_nA_n = A ⋂nAn=A),则 lim n → ∞ P ( A n ) = P ( lim n → ∞ A n ) = P ( A ) \lim_{n\to\infin}P(A_n) = P(\lim_{n\to\infin}A_n) = P(A) n→∞limP(An)=P(n→∞limAn)=P(A)
1.2 随机变量
- 概率都是对事件而言的,用于衡量事件发生的可能性大小,但由于概率定义域是样本空间中的样本点而不是数,高等数学的分析工具没法使用。为了便于分析,把随机事件数量化,即得到随机变量
随机变量
:称 X : Ω → R X:\Omega\to\mathbb{R} X:Ω→R 为随机变量,若 ∀ x ∈ R \forall x\in \mathbb{R} ∀x∈R,有
{ X ≤ x } ∈ F , 或 者 { X < x } ∈ F \{X\leq x\}\in\mathscr{F}, 或者 \{X<x\}\in\mathscr{F} {X≤x}∈F,或者{X<x}∈F
更进一步,称 F ( x ) = P { X ≤ x } F(x) = P\{X\leq x\} F(x)=P{X≤x} 为随机变量 X X X 的分布函数注:这里 { X ≤ x } \{X\leq x\} {X≤x} 代表样本空间中映射为数后值小于 x x x 的样本点的集合,即事件域的一个子集。我们知道分布函数描述的就是这个集合的概率,因此其一定是个事件, ∈ F \in \mathscr{F} ∈F
1.3 分布函数
分布函数
F ( x ) F(x) F(x) 满足:- F ( x ) F(x) F(x) 为非降函数
- F ( − ∞ ) = 0 , F ( + ∞ ) = 1 F(-\infin) = 0,\space F(+\infin) = 1 F(−∞)=0, F(+∞)=1
-
F
(
x
)
F(x)
F(x) 为
右连续
,即 F ( x + ) = lim y ↓ x F ( y ) = F ( x ) F(x^+) = \lim_{y\downarrow x}F(y) = F(x) F(x+)=limy↓xF(y)=F(x)
-
F
(
x
)
F(x)
F(x) 左极限
F
(
x
−
)
=
lim
y
↑
x
F
(
y
)
=
P
(
X
<
x
)
F(x^-) = \lim_{y\uparrow x}F(y) = P(X<x)
F(x−)=limy↑xF(y)=P(X<x),因此
F
F
F 只有跳跃型间断点,且
△ x F = F ( x + ) − F ( x − ) = P ( X ≤ x ) − P ( X < x ) = P ( X = x ) \begin{aligned} \triangle_xF &= F(x^+)-F(x^-) \\ &= P(X\leq x)-P(X<x)\\ &= P(X=x) \end{aligned} △xF=F(x+)−F(x−)=P(X≤x)−P(X<x)=P(X=x)
由此可以推出:- 分布函数在任何一 x x x 点处的振幅,等于随机变量在这个 x x x 点处取值的概率
- 连续型随机变量在单点处取值的概率为0
- 分布函数示例(离散型随机变量)
n元随机变量的分布函数
:若 X 1 , . . . , X n X_1,...,X_n X1,...,Xn 是随机变量,则称 ( X 1 , . . . , X n ) (X_1,...,X_n) (X1,...,Xn) 为随机向量或n维随机变量
,且分布函数定义为
F ( x 1 , . . . , x n ) = P ( X 1 ≤ x 1 , . . . , X n ≤ x n ) , x 1 , . . . , x n ∈ R F(x_1,...,x_n) = P\big(X_1\leq x_1,...,X_n\leq x_n\big), x_1,...,x_n \in \mathbb{R} F(x1,...,xn)=P(X1≤x1,...,Xn≤xn),x1,...,xn∈R
1.4 常用的随机变量
2. Riemann-Stieltjes 积分
- 对于任何随机变量,都有分布函数,根据分布函数性质的不同,可以把随机变量分为
- 离散型随机变量:分布函数是折线函数
- 连续型随机变量:分布函数是连续可导函数
- 本科阶段,对离散型随机变量和连续型随机变量单独定义了数学期望和条件数学期望。但是还有很多分布函数既不是离散的也不是连续的,怎么对这类一般的分布函数定义数学期望呢 ?这就需要用到 Riemann-Stieltjes 积分。本文先介绍 R-S 积分,然后下篇文章 随机过程(1.2)—— 数学期望与条件期望 再给出数学期望的相关定义
2.1 Riemann-Stieltjes 积分
定义任何积分,都遵循三个步骤:分割、求和、取极限,前两条对于所有积分都是一样的,不同的取极限方式对应了不同的积分
-
定义积分 ∫ a b f ( x ) d F ( x ) \int_a^b f(x)dF(x) ∫abf(x)dF(x):
- 分割:若
f
(
x
)
,
F
(
x
)
f(x),F(x)
f(x),F(x) 为
[
a
,
b
]
[a,b]
[a,b] 上的两个函数,在
[
a
,
b
]
[a,b]
[a,b] 上插入分点:
a = x 0 < x 1 < . . . < x n = b a = x_0<x_1<...<x_n = b a=x0<x1<...<xn=b - 求和:在每一个小区间
[
x
i
−
1
,
x
i
]
[x_{i-1},x_i]
[xi−1,xi] 中任选一点
ξ
i
\xi_i
ξi,作和式
σ n = ∑ i = 1 n f ( ξ i ) ( F ( x i ) − F ( x i − 1 ) ) \sigma_n = \sum_{i=1}^n f(\xi_i)\big(F(x_i)-F(x_{i-1})\big) σn=i=1∑nf(ξi)(F(xi)−F(xi−1)) - 取极限:若当
λ
n
:
=
max
1
≤
i
≤
n
{
X
i
−
X
i
−
1
}
→
0
\lambda_n := \max_{1\leq i\leq n}\{X_i-X_{i-1}\} \to 0
λn:=max1≤i≤n{Xi−Xi−1}→0 时,
σ
n
→
σ
\sigma_n \to \sigma
σn→σ,则称
f
(
x
)
f(x)
f(x) 在
[
a
,
b
]
[a,b]
[a,b] 上关于
F
(
x
)
F(x)
F(x) R-S 可积,且记
σ = ∫ a b f ( x ) d F ( x ) \sigma = \int_a^bf(x)dF(x) σ=∫abf(x)dF(x)
Riemann-Stieltjes 积分和常见的 Riemann 积分的区别,仅在于微分元从 d x dx dx 变成了 d F ( x ) dF(x) dF(x),可以理解为衡量的尺度发生了变化
- 分割:若
f
(
x
)
,
F
(
x
)
f(x),F(x)
f(x),F(x) 为
[
a
,
b
]
[a,b]
[a,b] 上的两个函数,在
[
a
,
b
]
[a,b]
[a,b] 上插入分点:
-
定理:若 f ( x ) f(x) f(x) 为 [ a , b ] [a,b] [a,b] 上的连续函数 / 单调函数 / 不连续点有可数多个的函数, F ( x ) F(x) F(x) 为 [ a , b ] [a,b] [a,b] 上单调函数,则 f ( x ) f(x) f(x) 关于 F ( x ) F(x) F(x) 在 [ a , b ] [a,b] [a,b] 上可积。特别的,当 F ( x ) = x F(x) = x F(x)=x 时,R-S积分退化为常见的 Riemann 积分
2.2 基本性质
- 以下性质可以通过定义(分割求和取极限)证明
2.3 三个重要例子
2.3.1 关于折线函数的 R-S 积分
- 若
f
(
x
)
f(x)
f(x) 在
[
a
,
b
]
[a,b]
[a,b] 中的点
c
c
c 处 连续,令
F
c
(
x
)
=
{
p
,
x
≥
c
q
,
x
<
c
F_c(x)=\left\{\begin{aligned}p, \space\space x\geq c \\q,\space\space x<c\end{aligned}\right.
Fc(x)={p, x≥cq, x<c,则
∫
a
b
f
(
x
)
d
F
c
(
x
)
=
f
(
c
)
(
p
−
q
)
\int_a^bf(x)dF_c(x)=f(c)(p-q)
∫abf(x)dFc(x)=f(c)(p−q)
2.3.2 关于阶梯函数的 R-S 积分
- 若 F ( x ) F(x) F(x) 为阶梯函数(跳跃函数),在 x i ( i = 1 , 2 , . . . , n ) x_i(i=1,2,...,n) xi(i=1,2,...,n) 处的振幅为 p i p_i pi,若 f ( x ) f(x) f(x) 在这些间断点处 连续,则 ∫ a b f ( x ) d F c ( x ) = ∑ i = 1 n f ( x i ) p i \int_a^bf(x)dF_c(x)=\sum_{i=1}^nf(x_i)p_i ∫abf(x)dFc(x)=i=1∑nf(xi)pi
- 由此可得离散型随机变量的期望,详见下篇文章
2.3.3 关于连续函数的 R-S 积分
- 若 F ′ ( x ) = p ( x ) F'(x) = p(x) F′(x)=p(x),则 ∫ a b f ( x ) d F c ( x ) = ∫ a b f ( x ) p ( x ) d x \int_a^bf(x)dF_c(x)=\int_a^bf(x)p(x)dx ∫abf(x)dFc(x)=∫abf(x)p(x)dx
- 由此可得连续型随机变量的期望,详见下篇文章