测度论与概率论笔记1:可测空间与可测函数

Riemann积分的缺陷

在数学分析中我们学过定积分和重积分,并且知道定积分的几何意义的曲边梯形的面积。然而,以如此方式定义面积,可能会产生某些本应该有面积的点集没有面积。比如狄利克雷函数 D ( x ) = { 1 x ∈ Q 0 x ∉ Q D(x)=\begin{cases}1&x\in Q\\0&x\notin Q\end{cases} D(x)={10xQx/Q
我们可以这么考虑,由于有理数集 Q Q Q是可数的,我们可以将全体有理数排列为 q 1 , q 2 , ⋯   , q n , ⋯ q_1,q_2,\cdots,q_n,\cdots q1,q2,,qn,定义 f i ( x ) = { 1 x = q i 0 x ≠ q i f_i(x)=\begin{cases} 1& x=q_i\\ 0& x\neq q_i \end{cases} fi(x)={10x=qix=qi那么按照黎曼积分的定义 ∫ 0 1 f i ( x ) d x = 0 \int_0^1f_i(x)dx=0 01fi(x)dx=0 D ( x ) = ∑ n = 1 ∞ f i ( x ) \displaystyle D(x)=\sum_{n=1}^\infty f_i(x) D(x)=n=1fi(x),显然,以 y = f i ( x ) y=f_i(x) y=fi(x)为边的曲边梯形实质上就是一条线段 x = q i , 0 ≤ y ≤ 1 x=q_i,0\le y\le 1 x=qi,0y1,在二维平面上的面积应该是 0 0 0 y = D ( x ) , 0 ≤ x ≤ 1 y=D(x),0\le x\le1 y=D(x),0x1可以看作可数条这样的线段相加,那么理应有 ∫ 0 1 D ( x ) d x = ∑ n = 1 ∞ ∫ 0 1 f n ( x ) d x = 0 \int_0^1D(x)dx=\sum_{n=1}^\infty \int_0^1f_n(x)dx=0 01D(x)dx=n=101fn(x)dx=0然而在黎曼积分的意义下,以上式子是不成立的,原因是 D ( x ) D(x) D(x) [ 0 , 1 ] [0,1] [0,1]上是不可积的,因为对任意的区间 [ a , b ] ⊆ [ 0 , 1 ] [a,b]\subseteq [0,1] [a,b][0,1] D ( x ) D(x) D(x) [ a , b ] [a,b] [a,b]上的上确界为1,下确界为0,这是由有理数和无理数的稠密性决定的。如此一来不论作任何分划 Δ : 0 = x 0 < x 1 < ⋯ < x n = 1 \Delta:0=x_0<x_1<\cdots<x_n=1 Δ:0=x0<x1<<xn=1,都有 S ‾ ( D ( x ) , Δ ) = 1 S ‾ ( D ( x ) , Δ ) = 0 \overline{S}(D(x),\Delta)=1\\ \underline{S}(D(x),\Delta)=0 S(D(x),Δ)=1S(D(x),Δ)=0显然 D ( x ) D(x) D(x)是不可积的,这说明黎曼积分以及黎曼积分背后的Jordan测度是有缺陷的。对于有界函数 f ( x ) f(x) f(x),我们知道Riemann可积的充要条件是 lim ⁡ λ ( Δ ) → 0 ∑ k = 1 n w k Δ x k = 0 \lim_{\lambda(\Delta)\to 0}\sum_{k=1}^nw_k\Delta x_k=0 λ(Δ)0limk=1nwkΔxk=0这个条件的实质是要求 f ( x ) f(x) f(x)几乎是连续的,这样,在我们区间越分越细的过程中,在大多数区间上, f ( x ) f(x) f(x)可以视为常数,如此一来 f ( x ) f(x) f(x)才可积,但是如果 f ( x ) f(x) f(x)始终保持剧烈动荡的情况下(如 D ( x ) D(x) D(x),任何小区间既有有理数,又有无理数),就不可能满足上面的条件,我们就有遗漏某些本应当可积的函数的可能性。对此,我们的解决方案是,对Riemann积分进行推广,产生一种新的积分,如果 f ( x ) f(x) f(x)是黎曼可积的,在这种新的积分定义下还是可积的,并且积分值相等,同时,还存在某些黎曼不可积的函数在新积分下也可积,如 D ( x ) D(x) D(x),如何定义这种新积分呢?Lebesgue积分给了我们一种定义积分的全新思路!在黎曼积分下,我们通过划分定义域来定义积分,然后这种定义方式可能使得我们在每个小区间上 f ( x ) f(x) f(x)剧烈震荡,使得和式无法收敛。Lebesgue采取的方式是划分值域,即如果 f ( x ) f(x) f(x)是有界函数,并且 a ≤ f ( x ) ≤ b a\le f(x)\le b af(x)b,则我们划分值域 a = y 0 < y 1 < ⋯ < y n = b a=y_0<y_1<\cdots<y_n=b a=y0<y1<<yn=b,相应地也划分了定义域 E i = { x : y i − 1 < f ( x ) ≤ y i } E_i=\{x:y_{i-1}<f(x)\le y_i\} Ei={x:yi1<f(x)yi},如果 E i E_i Ei也有长度,设为 m ( E i ) m(E_i) m(Ei),则估计和式为 ∑ i = 1 n y i − 1 m ( E i ) \sum_{i=1}^ny_{i-1}m(E_i) i=1nyi1m(Ei)如果在值域越分越细的情况下,以上和式极限存在,就是 f ( x ) f(x) f(x)的积分。这就产生了一个问题,如何定义 m ( E i ) m(E_i) m(Ei),在定义了 m ( E i ) m(E_i) m(Ei)后,就可以产生一种新的积分,即Lebesgue积分。可见,解决线段的长度、平面图形的面积、立体的体积问题是定义新的积分的前提。我们暂且先不谈如何定义 m ( E i ) m(E_i) m(Ei),我们首先谈谈长度、面积、体积应该满足什么性质:

(1)首先 m ( E ) m(E) m(E)应当是点集的函数,换句话说, m m m是幂集 m ( X ) m(X) m(X)到非负实数集的映射
(2)在中学学几何时,我们就有一种朴素的解题方法,即割补法,即如果 E 1 , ⋯   , E n E_1,\cdots,E_n E1,,En两两不交,应当有 m ( ⋃ k = 1 n E k ) = ∑ k = 1 n m ( E k ) m(\bigcup_{k=1}^nE_k)=\sum_{k=1}^nm(E_k) m(k=1nEk)=k=1nm(Ek)(3)对于区间 ( a , b ] (a,b] (a,b],应当有 m ( a , b ] = b − a m(a,b]=b-a m(a,b]=ba

这些性质Jordan测度也具备,在数学分析重积分一章中,我们已经论证过,如果 A , B A,B A,B都是J可测集, A ∪ B A\cup B AB也是J可测的,并且如果 A ∩ B A\cap B AB是J零测集,则 ∣ A ∪ B ∣ = ∣ A ∣ + ∣ B ∣ |A\cup B|=|A|+|B| AB=A+B。显然只有以上的性质并不足以让我们产生一种新的积分,因为对于 D ( x ) D(x) D(x)来说, { x : n − 1 n < D ( x ) ≤ 1 } = Q \{x:\frac{n-1}{n}<D(x)\le 1\}=Q {x:nn1<D(x)1}=Q,这是个J不可测集,也就是说,如果我们采取将 [ 0 , 1 ] [0,1] [0,1]区间 n n n等分,然后按Lebesgue方式定义新积分,在 n → ∞ n\to\infty n过程中,和式的极限还是不存在,根本原因在于 Q Q Q J J J不可测的。显然 Q = ⋃ n = 1 ∞ { q n } \displaystyle Q=\bigcup_{n=1}^\infty \{q_n\} Q=n=1{qn},而 m ( { q n } ) = 0 , n = 1 , 2 , ⋯ m(\{q_n\})=0,n=1,2,\cdots m({qn})=0,n=1,2,。如果新的测度满足可列可加性,就应当有 m ( Q ) = 0 m(Q)=0 m(Q)=0因此,我们把(3)加强到可列可加性:对两两不交的 { A n } \{A_n\} {An},有 m ( ⋃ n = 1 ∞ A n ) = ∑ n = 1 ∞ m ( A n ) m(\bigcup_{n=1}^\infty A_n)=\sum_{n=1}^\infty m(A_n) m(n=1An)=n=1m(An)那么就可能能够满足我们的需求。下一个问题是 m m m的定义域,我们当然希望 m m m是定义在整个幂集 m ( R ) m(R) m(R)上的,这样所有的线段都有长度,然而这时不可能的,正如对Jordan测度而言, m ( R ) m(R) m(R)上存在大量的J不可集,如 Q Q Q,新的测度也存在可测与否的问题,对于Jordan测度而言,我们仅仅要求有限可加性,相应地,我们只要求全体J可测集对有限运算封闭即可,对于新测度而言不是如此,我们要求可列可加性,因此我们还要求新的可测空间对极限运算也封闭。
总结上面的讨论,为了克服Riemann积分的缺陷,定义一种新的积分——Lebesgue积分,那么在定义Lebesgue积分之前,首先我们要讨论如何建立一种新的测度,我们称为Lebesgue测度,要求满足,第一,它是某个幂集的子集 M \mathcal{M} M到非负广义实数(对于无界集允许其测度为正无穷)的映射。第二,我们要求 m m m满足: m ( ∅ ) = 0 m(\emptyset)=0 m()=0,并且某些特殊集合的测度应当满足某些条件(至少要符合我们对长度、面积、体积)的直觉。第三, m m m要满足可列可加性,仅仅是有限可加性是不够的。第四,既然 m m m要满足可列可加性,那么 M \mathcal{M} M就应当对可列并封闭,而不能仅仅对有限并封闭。
这里的 M \mathcal{M} M就是 m m m的定义域,如同讨论数学分析之前,我们首先要建立对实函数的定义域实数域的一个认识,在讨论Lebesgue测度之前,我们要建立对幂集的子集,后面我们称为集系的认识,而且 M \mathcal{M} M不能是任取的集系,它应当对集合的运算封闭,而且不仅仅是有限运算,还应当是极限运算。

概率的公理化定义

现在我们分析学的领域转到初等概率论中,在初等概率论中,我们往往首先要定义一个样本空间 Ω \Omega Ω,其含义是随机试验可能出现的所有样本点,我们定义事件是 Ω \Omega Ω的子集,这样,我们就可以用集合论的工具对事件进行运算。概率是事件的函数,描述事件发生的可能性大小。由此可以看出,概率 P P P也是幂集 P ( Ω ) P(\Omega) P(Ω)的某个子集 F \mathcal{F} F(因为我们不是关心所有的事件,而仅仅关心部分事件罢了,更何况可能也无法定义整个幂集的概率函数)的函数,这和长度、面积、体积有几分相似。下面我们对古典概型和几何概型作一个简要的回顾,我们将发现,概率和长度、面积、体积这些概念,不仅仅只有他们都是幂集的某个子集的函数这一个共同点。

古典概型

如果样本空间 Ω \Omega Ω是一个有限集,我们记为 Ω = { w 1 , ⋯   , w n } \Omega=\{w_1,\cdots,w_n\} Ω={w1,,wn}我们的概率如此定义:首先定义一个 Ω \Omega Ω上的函数 p p p,满足 p ( w i ) = p i > 0 , i = 1 , ⋯   , n ∑ i = 1 n p i = 1 p(w_i)=p_i>0,i=1,\cdots,n\\ \sum_{i=1}^np_i=1 p(wi)=pi>0,i=1,,ni=1npi=1则对任意的 A ⊂ Ω A\subset \Omega AΩ,定义 P ( A ) = ∑ w ∈ A p ( w ) P ( ∅ ) = 0 P(A)=\sum_{w\in A}p(w)\\ P(\emptyset)=0 P(A)=wAp(w)P()=0容易验证它满足:
(1) P ( Ω ) = 1 P(\Omega)=1 P(Ω)=1
(2) ∀ A ⊆ Ω , P ( A ) ∈ [ 0 , 1 ] \forall A\subseteq \Omega,P(A)\in[0,1] AΩ,P(A)[0,1]
(3) P P P满足有限可加性
当然, P P P可不仅仅满足有限可加性,还满足可列可加性,这是因为如果集列 { A n } \{A_n\} {An}两两不交,由于 Ω \Omega Ω是有限集, { A n } \{A_n\} {An}只能有有限个集合非空,从而由有限可加性可以推得可列可加性也是成立的。如此一来, P P P可以视为是 P ( Ω ) P(\Omega) P(Ω)上的“长度、面积或体积”,我们称为测度,只不过这个测度是有限的,因为 P ( Ω ) = 1 P(\Omega)=1 P(Ω)=1

几何概型

几何概型则更明显了,假设我们已经定义了Lebesgue测度 m m m,对于有限测度的某个子集 A A A,设样本空间为 A A A,我们可以建立一个 A A A的L可测子集 B B B的概率为 P ( B ) = m ( B ) m ( A ) P(B)=\frac{m(B)}{m(A)} P(B)=m(A)m(B)由Lebesgue测度的性质 P ( B ) P(B) P(B)当然满足
(1) P ( A ) = 1 , P ( ∅ ) = 0 P(A)=1,P(\emptyset)=0 P(A)=1,P()=0
(2)对 A A A的任意的L可测子集 B B B,都有 0 ≤ P ( B ) ≤ 1 0\le P(B)\le 1 0P(B)1
(3) P P P满足可列可加性
由此可见, P P P也是一种测度,只不过这种测度 P P P是有限的, P ( A ) = 1 P(A)=1 P(A)=1

概率的公理化定义

由此可见,概率和长度、面积、体积这些概念有共通之处,都满足:

(1) m ( ∅ ) = 0 m(\emptyset)=0 m()=0 ∀ A ∈ F , m ( A ) ≥ 0 \forall A\in \mathcal{F},m(A)\ge 0 AF,m(A)0
(2) m m m满足可列可加性

对于 m m m其定义域 F \mathcal{F} F首先应当对可列并封闭,否则可列可加性就无从谈起,其次,在概率论中,如果 A ∈ F A\in \mathcal{F} AF,那么应当有 A c ∈ F A^c\in\mathcal{F} AcF,也就是说我们对其对立事件也感兴趣,再其次 F \mathcal{F} F还要囊括必然事件 Ω \Omega Ω和不可能事件 ∅ \emptyset ,归纳起来, F \mathcal{F} F应当满足:

(1) Ω ∈ F \Omega \in \mathcal{F} ΩF
(2)如果 A ∈ F A\in \mathcal{F} AF,那么应当有 A c ∈ F A^c\in \mathcal{F} AcF
(3)如果 A n ∈ F , n = 1 , 2 , ⋯ A_n\in \mathcal{F},n=1,2,\cdots AnF,n=1,2,,那么 ⋃ n = 1 ∞ A n ∈ F \displaystyle\bigcup_{n=1}^\infty A_n\in\mathcal{F} n=1AnF

我们称这类集系为 σ \sigma σ代数,我们把定义在某个 σ \sigma σ代数 F \mathcal{F} F上满足(1)(2)的(广义)集函数 m m m称为 F \mathcal{F} F的测度,进一步地,如果 m m m还满足 m ( Ω ) = 1 m(\Omega)=1 m(Ω)=1则称 m m m为概率测度,这就是概率的公理化定义。从这里可以看出,概率和长度、面积、体积都是测度,以测度、可测函数及可测函数积分为基本研究对象的测度论是初等概率论和实变函数论的提高和抽象。本学习笔记的目的是利用测度论对概率论进行严格化的表述,在这个过程中,澄清一些初等概率论不可能讲清楚的一些概念(如条件概率、条件期望、随机变量的分类),同时搭起初等概率论与公理化概率论的桥梁。

集合的运算

集合是现代数学的基本概念,一群可以相互区别的事物就可以构成集合,构成集合的事物称为元素\。某个元素和某个集合的关系只有两种,属于和不属于。

交运算 A ∩ B A\cap B AB定义为 A ∩ B = { x : x ∈ A 且 x ∈ B } A\cap B=\{x:x\in A且x\in B\} AB={x:xAxB}
并运算 A ∪ B A\cup B AB定义为 A ∪ B = { x : x ∈ A 或 x ∈ B } A\cup B=\{x:x\in A或x\in B\} AB={x:xAxB}
差运算 A − B A-B AB(或写成 A /   B A/\ B A/ B)定义为 A − B = { x : x ∈ A 且 x ∉ B } A-B=\{x:x\in A且x\notin B\} AB={x:xAx/B}
子集 A ⊆ B A\subseteq B AB定义为: ∀ x ∈ A , x ∈ B \forall x\in A,x\in B xA,xB
集合相等 A = B A=B A=B定义为 x ∈ A x\in A xA x ∈ B x\in B xB是等价的
证明集合相等常常证明: A ⊆ B A\subseteq B AB B ⊆ A B\subseteq A BA
余集:如果定义了全集 X X X,则对任意 A ⊆ X A\subseteq X AX,定义 A c A^c Ac A c = X − A A^c=X-A Ac=XA
无穷交 { A t : t ∈ T } \{A_t:t\in T\} {At:tT}为一系列集合,其中 T T T为指标集, t t t可以用于对子集进行标号,则定义 ⋂ t ∈ T A t = { x : ∀ t ∈ T , x ∈ A t } \displaystyle\bigcap_{t\in T}A_t=\{x:\forall t\in T,x\in A_t\} tTAt={x:tT,xAt}
无穷并 { A t : t ∈ T } \{A_t:t\in T\} {At:tT}为一系列集合,其中 T T T为指标集,定义 ⋃ t ∈ T A t = { x : ∃ t 0 ∈ T , x ∈ A t 0 } \displaystyle\bigcup_{t\in T}A_t=\{x:\exists t_0\in T,x\in A_{t_0}\} tTAt={x:t0T,xAt0}
单调列:如果集合列 { A n , n = 1 , 2 , ⋯   } \{A_n,n=1,2,\cdots\} {An,n=1,2,}满足: A n ⊂ A n + 1 A_n\subset A_{n+1} AnAn+1,则称 { A n } \{A_n\} {An}为单调递增列,如果 A n + 1 ⊂ A n A_{n+1}\subset A_n An+1An,则称 { A n } \{A_n\} {An}为单调递减列
单调列的极限 { A n } \{A_n\} {An}为单调增列,则定义 lim ⁡ n → ∞ A n = ⋃ n = 1 ∞ A n \displaystyle \lim_{n\to \infty}A_n=\bigcup_{n=1}^\infty A_n nlimAn=n=1An,如果 { A n } \{A_n\} {An}为单调减列,则定义 lim ⁡ n → ∞ A n = ⋂ n = 1 ∞ A n \displaystyle\lim_{n\to\infty}A_n=\bigcap_{n=1}^\infty A_n nlimAn=n=1An
集列的上下极限:定义集列 { A n } \{A_n\} {An}的上极限为 lim sup ⁡ n → ∞ A n = ⋂ n = 1 ∞ ⋃ k = n ∞ A k \displaystyle\limsup_{n\to\infty}A_n=\bigcap_{n=1}^\infty\bigcup_{k=n}^\infty A_k nlimsupAn=n=1k=nAk,定义集列 { A n } \{A_n\} {An}的下极限为 lim inf ⁡ n → ∞ A n = ⋃ n = 1 ∞ ⋂ k = n ∞ A k \displaystyle \liminf_{n\to\infty}A_n=\bigcup_{n=1}^\infty\bigcap_{k=n}^\infty A_k nliminfAn=n=1k=nAk,容易证明对任意集系 { A n } \{A_n\} {An}都有 lim inf ⁡ n → ∞ A n ⊆ lim sup ⁡ n → ∞ A n \displaystyle \liminf_{n\to\infty}A_n\subseteq \limsup_{n\to\infty}A_n nliminfAnnlimsupAn
集列的极限:如果对集系 { A n } \{A_n\} {An},有 lim inf ⁡ n → ∞ A n = lim sup ⁡ n → ∞ A n \displaystyle\liminf_{n\to\infty}A_n=\limsup_{n\to\infty}A_n nliminfAn=nlimsupAn,则称 { A n } \{A_n\} {An}的极限存在,记为 lim ⁡ n → ∞ A n = lim inf ⁡ n → ∞ A n = lim sup ⁡ n → ∞ A n \displaystyle \lim_{n\to\infty}A_n=\liminf_{n\to\infty}A_n=\limsup_{n\to\infty}A_n nlimAn=nliminfAn=nlimsupAn
德摩根公式
( A ∩ B ) c = A c ∪ B c ( A ∪ B ) c = A c ∩ B c ( ⋃ t ∈ T A t ) c = ⋂ t ∈ T A t c ( ⋂ t ∈ T A t ) c = ⋃ t ∈ T A t c (A\cap B)^c=A^c\cup B^c\\ (A\cup B)^c=A^c\cap B^c\\ (\bigcup_{t\in T}A_t)^c=\bigcap_{t\in T}A_t^c\\ (\bigcap_{t\in T}A_t)^c=\bigcup_{t\in T}A_t^c (AB)c=AcBc(AB)c=AcBc(tTAt)c=tTAtc(tTAt)c=tTAtc
集合的运算还满足分配律: A ∩ ( B ∪ C ) = ( B ∪ C ) ∩ A = ( A ∩ B ) ∪ ( A ∩ C ) A ∪ ( B ∩ C ) = ( B ∩ C ) ∪ A = ( A ∪ C ) ∩ ( A ∪ B ) A ∩ ( ⋃ t ∈ T B t ) = ⋃ t ∈ T ( A ∩ B t ) A ∪ ( ⋂ t ∈ T B t ) = ⋂ t ∈ T ( A ∪ B t ) A\cap(B\cup C)=(B\cup C)\cap A=(A\cap B)\cup (A\cap C)\\ A\cup(B\cap C)=(B\cap C)\cup A=(A\cup C)\cap (A\cup B)\\ A\cap(\bigcup_{t\in T}B_t)=\bigcup_{t\in T}(A\cap B_t)\\ A\cup(\bigcap_{t\in T}B_t)=\bigcap_{t\in T}(A\cup B_t) A(BC)=(BC)A=(AB)(AC)A(BC)=(BC)A=(AC)(AB)A(tTBt)=tT(ABt)A(tTBt)=tT(ABt)当然集合运算还满足交换律和结合律,这里就不列举了

集系与集系的生成

定义1.1 对于集合 X X X,定义 X X X全体子集构成的集合为 P ( X ) \mathscr{P}(X) P(X),称为 X X X的幂集,幂集的子集称为 X X X上的集系

一般而言,我们习惯于将集系写成花体字母 A , B , ⋯ \mathscr{A},\mathscr{B},\cdots A,B,。对于测度论而言,我们需要的不是任意的集系,而是对集合运算封闭的集系:
对有限交封闭:如果 A , B ∈ A A,B\in \mathscr{A} A,BA,则有 A ∩ B ∈ A A\cap B \in \mathscr{A} ABA
对有限并封闭:如果 A , B ∈ A A,B\in \mathscr{A} A,BA,则有 A ∪ B ∈ A A\cup B\in \mathscr{A} ABA
对差运算封闭:如果 A , B ∈ A A,B\in \mathscr{A} A,BA,则有 A − B ∈ A A -B\in \mathscr{A} ABA
对有限不交并封闭:对任意 A ∩ B = ∅ , A , B ∈ A A\cap B=\emptyset,A,B\in \mathscr{A} AB=,A,BA,都有 A ∪ B ∈ A A\cup B\in \mathscr{A} ABA
类似地可以写出对可列交封闭,对可列并封闭等定义

下面,我们将给出几个常用的集系
π \pi π:如果集系 A \mathscr{A} A对有限交封闭,则称 A \mathscr{A} A π \pi π
半环:如果集系 R \mathscr{R} R π \pi π系,并且对任意的 A , B ∈ A A,B\in\mathscr{A} A,BA,存在 A \mathscr{A} A中两两不交的 m m m个集合 C 1 , ⋯   , C m C_1,\cdots,C_m C1,,Cm,满足 A − B = ⋃ k = 1 m C k A-B=\bigcup_{k=1}^mC_k AB=k=1mCk则称 R \mathscr{R} R为半环
:如果集系 R \mathscr{R} R对有限交和差运算封闭,则称 R \mathscr{R} R为环
代数(域):如果集系 R \mathscr{R} R π \pi π系,并且如果 A ∈ R , A c ∈ R A\in\mathscr{R},A^c\in\mathscr{R} AR,AcR,则称 R \mathscr{R} R为代数或域
单调系:如果集系 R \mathscr{R} R对任何单调列的极限封闭,则称 R \mathscr{R} R是单调系
λ \lambda λ:如果 A \mathscr{A} A满足:
(1) X ∈ A X\in \mathscr{A} XA
(2) A ∈ A A\in \mathscr{A} AA则有 A c ∈ A A^c\in\mathscr{A} AcA
(3) { A n } \{A_n\} {An} A \mathscr{A} A中的单调增列, A n ↑ A A_n\uparrow A AnA,则 A ∈ A A\in\mathscr{A} AA
σ \sigma σ代数或 σ \sigma σ:如果集系 F \mathscr{F} F满足:
(1) X ∈ F X\in\mathscr{F} XF
(2) F \mathscr{F} F对余运算封闭
(3) F \mathscr{F} F对可列不交并封闭
σ \sigma σ:如果集系 F \mathscr{F} F对差运算可可列不交并运算封闭,则称 F \mathscr{F} F σ \sigma σ

上面只是列举了这些集系的定义,下面我们对集系之间的包含关系进行讨论:
(1)显然,半环是 π \pi π系,这是半环的定义规定的,而环也是 π \pi π系,这是因为设 R \mathscr{R} R是环,如果 A , B ∈ R A,B\in\mathscr{R} A,BR,则按照环的定义 A ∪ B , A − B , B − A ∈ R A\cup B,A-B,B-A\in\mathscr{R} AB,AB,BAR,而 A ∩ B = A ∪ B − ( A − B ) − ( B − A ) A\cap B=A\cup B-(A-B)-(B-A) AB=AB(AB)(BA),从而 A ∩ B ∈ R A\cap B\in \mathscr{R} ABR,因而环是 π \pi π系,自然也是半环
(2)代数是环,设 R \mathscr{R} R是代数,首先如果 A , B ∈ R A,B\in \mathscr{R} A,BR,则 A c , B c ∈ R A^c,B^c\in\mathscr{R} Ac,BcR,故 A c ∩ B c ∈ R A^c\cap B^c\in\mathscr{R} AcBcR,从而 A ∪ B = ( A c ∩ B c ) c ∈ R A\cup B=(A^c\cap B^c)^c\in\mathscr{R} AB=(AcBc)cR而对差运算封闭是显然的
(3) σ \sigma σ环显然是环,但不一定是代数, σ \sigma σ代数一定是代数,实际上,代数与环, σ \sigma σ代数和 σ \sigma σ环的差别就在于是否有 X ∈ R X\in\mathscr{R} XR
(4) λ \lambda λ系一定是单调类,实际上我们只要验证如果 { A n } \{A_n\} {An}是单调减列, A n ↓ A A_n\downarrow A AnA,则有 A ∈ A A\in \mathscr{A} AA A n c ∈ A A_n^c\in \mathscr{A} AncA,且 { A n c } \{A_n^c\} {Anc}是单调增列,则 ⋃ n = 1 ∞ A n c ∈ R \displaystyle\bigcup_{n=1}^\infty A_n^c\in\mathscr{R} n=1AncR,故 ( ⋃ n = 1 ∞ A n c ) c = ⋂ n = 1 ∞ A n ∈ R (\bigcup_{n=1}^\infty A_n^c)^c=\bigcap_{n=1}^\infty A_n\in \mathscr{R} (n=1Anc)c=n=1AnR(5)显然 σ \sigma σ代数一定是 λ \lambda λ
于是,经过上面的讨论,我们可以得到以上几类集系的关系图如下:
在这里插入图片描述

下面我们给出一个重要的定理

定理1.1 (1)如果集系 F \mathscr{F} F既是单调系又是代数(环),则 F \mathscr{F} F σ \sigma σ代数( σ \sigma σ环)
(2)如果集系 F \mathscr{F} F既是 λ \lambda λ系又是 π \pi π系,则 F \mathscr{F} F σ \sigma σ代数

证:
(1)如果 F \mathscr{F} F既是单调系又是代数(环),则如果 A n ∈ F , n = 1 , 2 , ⋯ A_n\in \mathscr{F},n=1,2,\cdots AnF,n=1,2,,那么 ⋃ k = 1 n A k ∈ F \bigcup_{k=1}^nA_k\in \mathscr{F} k=1nAkF并且集系 { ⋃ k = 1 n A k } \displaystyle\{\bigcup_{k=1}^nA_k\} {k=1nAk}是单调增列,且 ⋃ k = 1 n A k ↑ ⋃ n = 1 ∞ A n \displaystyle\bigcup_{k=1}^nA_k\uparrow \bigcup_{n=1}^\infty A_n k=1nAkn=1An,则由于 F \mathscr{F} F是一个单调系,有 ⋃ n = 1 ∞ A n ∈ F \displaystyle \bigcup_{n=1}^\infty A_n\in\mathscr{F} n=1AnF,这就证明了 F \mathscr{F} F σ \sigma σ代数( σ \sigma σ环)
(2)如果 A n ∈ F , n = 1 , ⋯   , n , ⋯ A_n\in\mathscr{F},n=1,\cdots,n,\cdots AnF,n=1,,n,,则 A n c ∈ F , n = 1 , 2 , ⋯ A_n^c\in\mathscr{F},n=1,2,\cdots AncF,n=1,2,,由于 F \mathscr{F} F π \pi π系,就有 ⋂ k = 1 n A k c ∈ F \bigcap_{k=1}^nA_k^c\in\mathscr{F} k=1nAkcF { ⋂ k = 1 n A k c } \displaystyle\{\bigcap_{k=1}^nA_k^c\} {k=1nAkc}是单调减列, F \mathscr{F} F λ \lambda λ系因而是单调系, ⋂ k = 1 n A k c ↓ ⋂ n = 1 ∞ A n c \displaystyle \bigcap_{k=1}^nA_k^c\downarrow\bigcap_{n=1}^\infty A_n^c k=1nAkcn=1Anc,从而 ⋂ n = 1 ∞ A n c ∈ F \bigcap_{n=1}^\infty A_n^c\in \mathscr{F} n=1AncF从而 ( ⋂ n = 1 ∞ A n c ) c = ⋃ n = 1 ∞ A n ∈ F (\bigcap_{n=1}^\infty A_n^c)^c=\bigcup_{n=1}^\infty A_n\in \mathscr{F} (n=1Anc)c=n=1AnF F \mathscr{F} F σ \sigma σ代数

例1.1 R n R^n Rn上全体有限开区间、有限左开右闭区间、有限左闭右开区间和闭区间构成的集合都是 π \pi π系,另外,全体有限左开右闭区间构成的集系是半环(只要分类讨论很容易验证)

例1.2 R n R^n Rn上左开右闭矩体定义为 ∏ k = 1 n ( a k , b k ] = { ( x 1 , ⋯   , x n ) : a k < x k ≤ b k , k = 1 , ⋯   , n } \prod_{k=1}^n(a_k,b_k]=\{(x_1,\cdots,x_n):a_k<x_k\le b_k,k=1,\cdots,n\} k=1n(ak,bk]={(x1,,xn):ak<xkbk,k=1,,n}全体 R n R^n Rn上左开右闭矩体 R n R^n Rn的一个半环

证:
I 1 1 , I 2 1 , ⋯   , I n 1 , I 1 2 , I 2 2 , ⋯   , I n 2 I_1^1,I_2^1,\cdots,I_n^1,I_1^2,I_2^2,\cdots,I_n^2 I11,I21,,In1,I12,I22,,In2 R R R 2 n 2n 2n个左开右闭的区间,现在我们要求 ( ∏ k = 1 n I k 2 ) c \displaystyle(\prod_{k=1}^nI_k^2)^c (k=1nIk2)c,实际我们只要考察一下笛卡尔积的定义即可, ( x 1 , ⋯   , x n ) ∈ ∏ k = 1 n I k 2 \displaystyle(x_1,\cdots,x_n)\in \prod_{k=1}^nI_k^2 (x1,,xn)k=1nIk2等价于对任意的 k = 1 , ⋯   , n k=1,\cdots,n k=1,,n,都有 x k ∈ I k 2 x_k\in I_k^2 xkIk2,因此, ( x 1 , ⋯   , x n ) ∈ ( ∏ k = 1 n I k 2 ) c \displaystyle(x_1,\cdots,x_n)\in (\prod_{k=1}^nI_k^2)^c (x1,,xn)(k=1nIk2)c等价于存在 k 0 = 1 , 2 , ⋯ k_0=1,2,\cdots k0=1,2, n n n x k 0 ∈ I k c x_{k_0}\in I_k^c xk0Ikc,故我们可以把 ( ∏ k = 1 n I k 2 ) c \displaystyle(\prod_{k=1}^nI_k^2)^c (k=1nIk2)c写成 ( ∏ k = 1 n I k 2 ) c = ⋃ k = 1 n ∏ i = 1 k − 1 I i 2 × ( I k 2 ) c × ∏ i = k + 1 n R (\prod_{k=1}^nI_k^2)^c=\bigcup_{k=1}^n\prod_{i=1}^{k-1}I_i^2\times (I_k^{2} )^c\times\prod_{i=k+1}^nR (k=1nIk2)c=k=1ni=1k1Ii2×(Ik2)c×i=k+1nR分解式右边的 n n n个集合两两不交(由构造可以看出来),而对 k = 1 , ⋯   , n k=1,\cdots,n k=1,,n,有 ( ∏ i = 1 k − 1 I i 2 × ( I k 2 ) c × ∏ i = k + 1 n R ) ∩ ∏ i = 1 n I i 1 = ∏ i = 1 k − 1 ( I i 1 ∩ I i 2 ) × ( I k 1 − I k 2 ) × ∏ i = k + 1 n I i 1 (\prod_{i=1}^{k-1}I_i^2\times (I_k^2)^c \times\prod_{i=k+1}^nR)\cap\prod_{i=1}^n I_i^1=\prod_{i=1}^{k-1}(I_i^1\cap I_i^2)\times(I_k^1-I_k^2)\times\prod_{i=k+1}^nI_i^1 (i=1k1Ii2×(Ik2)c×i=k+1nR)i=1nIi1=i=1k1(Ii1Ii2)×(Ik1Ik2)×i=k+1nIi1存在有限个两两不交的左开右闭区间 I k 1 , ⋯   , I k n k I_{k1},\cdots,I_{kn_k} Ik1,,Iknk,满足 I k 1 − I k 2 = ⋃ j = 1 n k I k j I_k^1-I_k^2=\bigcup_{j=1}^{n_k}I_{kj} Ik1Ik2=j=1nkIkj于是 ( ∏ i = 1 k − 1 I i 2 × ( I k 2 ) c × ∏ i = k + 1 n R ) ∩ ∏ i = 1 n I i 1 = ⋃ j = 1 n k ∏ i = 1 k − 1 ( I i 1 ∩ I i 2 ) × I k j × ∏ i = k + 1 n I i 1 \begin{aligned} &(\prod_{i=1}^{k-1}I_i^2\times (I_k^2)^c \times\prod_{i=k+1}^nR)\cap\prod_{i=1}^n I_i^1\\=&\bigcup_{j=1}^{n_k}\prod_{i=1}^{k-1}(I_i^1\cap I_i^2)\times I_{kj}\times\prod_{i=k+1}^nI_i^1 \end{aligned} =(i=1k1Ii2×(Ik2)c×i=k+1nR)i=1nIi1j=1nki=1k1(Ii1Ii2)×Ikj×i=k+1nIi1因此 ∏ k = 1 n I k 1 − ∏ k = 1 n I k 2 = ⋃ k = 1 n ⋃ j = 1 n k ∏ i = 1 k − 1 ( I i 1 ∩ I i 2 ) × I k j × ∏ i = k + 1 n I i 1 \prod_{k=1}^nI_k^1-\prod_{k=1}^nI_k^2=\bigcup_{k=1}^n\bigcup_{j=1}^{n_k}\prod_{i=1}^{k-1}(I_i^1\cap I_i^2)\times I_{kj}\times\prod_{i=k+1}^nI_i^1 k=1nIk1k=1nIk2=k=1nj=1nki=1k1(Ii1Ii2)×Ikj×i=k+1nIi1分解式右边是 N = ∑ k = 1 n n k \displaystyle N=\sum_{k=1}^nn_k N=k=1nnk个两两不交的 R n R^n Rn中的区间,显然这个集系是 π \pi π系,故全体 R n R^n Rn中的左开右闭矩体构成一个半环

例1.3 显然从例1.2的证明可以看出,如果 A i \mathscr{A_i} Ai X i X_i Xi的半环 ( i = 1 , ⋯   , n ) (i=1,\cdots,n) (i=1,,n),则全体构造如 ∏ k = 1 n A k , A k ∈ A k , k = 1 , ⋯   , n \prod_{k=1}^nA_k,A_k\in\mathscr{A_k},k=1,\cdots,n k=1nAk,AkAk,k=1,,n构成的集系是 ∏ k = 1 n X k \prod_{k=1}^nX_k k=1nXk的半环,只需要将例1.2中的左开右闭区间换成 A i \mathscr{A_i} Ai的集合即可证得

例1.4 R \mathscr{R} R X X X上的半环,则对于任意的 A , B ∈ R A,B\in\mathscr{R} A,BR,有 A ∪ B A\cup B AB可表为 R \mathscr{R} R中两两不交集合之并,这是因为 A − B , B − A , A ∩ B A-B,B-A,A\cap B AB,BA,AB两两不交,由于 R \mathscr{R} R π \pi π系, A ∩ B ∈ R A\cap B\in \mathscr{R} ABR,同时 A − B , B − A A-B,B-A AB,BA可表为 R \mathscr{R} R中有限个两两不交的集合之并

例1.5 由全体有限个 R R R上两两不交的左开右闭区间之并构成是集合是 R R R上的环,这个集系可以写成 R = ⋃ n = 1 ∞ { ⋃ k = 1 n I k : I 1 , ⋯   , I n 为 两 两 不 交 的 左 开 右 闭 区 间 } \mathscr{R}=\bigcup_{n=1}^\infty\{\bigcup_{k=1}^nI_k:I_1,\cdots,I_n为两两不交的左开右闭区间\} R=n=1{k=1nIk:I1,,In}

证:
假设 I 1 1 , ⋯   , I n 1 I_1^1,\cdots,I_n^1 I11,,In1 n n n个两两不交的左开右闭区间, I 1 2 , ⋯   , I m 2 I_1^2,\cdots,I_m^2 I12,,Im2 m m m个两两不交的左开右闭区间,则 ⋃ k = 1 n I k 1 ∪ ⋃ k = 1 m I k 2 = ⋃ i = 1 n ⋃ j = 1 m I i 1 ∩ I j 2 \bigcup_{k=1}^nI_k^1\cup\bigcup_{k=1}^mI_k^2=\bigcup_{i=1}^n\bigcup_{j=1}^mI_i^1\cap I_j^2 k=1nIk1k=1mIk2=i=1nj=1mIi1Ij2显然右边的分解式两两不交,故 ⋃ k = 1 n I k 1 ∪ ⋃ k = 1 m I k 2 ∈ R \displaystyle \bigcup_{k=1}^nI_k^1\cup\bigcup_{k=1}^mI_k^2\in\mathscr{R} k=1nIk1k=1mIk2R,再证明 R \mathscr{R} R对差运算封闭 ⋃ i = 1 n I i 1 − ⋃ j = 1 m I j 2 = ⋃ i = 1 n ( I i 1 − ⋃ j = 1 m I j 2 ) = ⋃ i = 1 n ⋂ j = 1 m ( I i 1 − I j 2 ) \begin{aligned} &\bigcup_{i=1}^nI_{i}^1-\bigcup_{j=1}^mI_j^2=\bigcup_{i=1}^n(I_i^1-\bigcup_{j=1}^mI_j^2)=\bigcup_{i=1}^n\bigcap_{j=1}^m(I_i^1-I_j^2) \end{aligned} i=1nIi1j=1mIj2=i=1n(Ii1j=1mIj2)=i=1nj=1m(Ii1Ij2)由于全体左开右闭区间构成 R R R上的半环,对任意的 i = 1 , ⋯   , n , j = 1 , ⋯   , m i=1,\cdots,n,j=1,\cdots,m i=1,,n,j=1,,m,存在有限个两两不交的左开右闭区间 I 1 i j , I 2 i j , ⋯   , I n i j i j I_1^{ij},I_2^{ij},\cdots,I_{n_{ij}}^{ij} I1ij,I2ij,,Inijij,有 I i 1 − I j 2 = ⋃ k = 1 n i j I k i j I_i^1-I_j^2=\bigcup_{k=1}^{n_{ij}}I_k^{ij} Ii1Ij2=k=1nijIkij就有 ⋃ i = 1 n I i 1 − ⋃ j = 1 m I j 2 = ⋃ i = 1 n ( I i 1 − ⋃ j = 1 m I j 2 ) = ⋃ i = 1 n ⋂ j = 1 m ⋃ k = 1 n i j I k i j = ⋃ i = 1 n ⋃ k 1 = 1 n i 1 ⋯ ⋃ k m = 1 n i m ( I k 1 i 1 ∩ ⋯ ∩ I k m i m ) \begin{aligned} &\bigcup_{i=1}^nI_{i}^1-\bigcup_{j=1}^mI_j^2=\bigcup_{i=1}^n(I_i^1-\bigcup_{j=1}^mI_j^2)=\bigcup_{i=1}^n\bigcap_{j=1}^m\bigcup_{k=1}^{n_{ij}}I_k^{ij}\\ =&\bigcup_{i=1}^n\bigcup_{k_1=1}^{n_{i1}}\cdots\bigcup_{k_m=1}^{n_{im}}(I_{k_1}^{i1}\cap\cdots\cap I_{k_m}^{im}) \end{aligned} =i=1nIi1j=1mIj2=i=1n(Ii1j=1mIj2)=i=1nj=1mk=1nijIkiji=1nk1=1ni1km=1nim(Ik1i1Ikmim)由构造,分解式右边两两不交,故 R \mathscr{R} R对差运算封闭

例1.6 当然,例1.5也可以推广到一般的半环,如果 A \mathscr{A} A X X X上的半环,则 R = ⋃ n = 1 ∞ { ⋃ k = 1 n A k : A 1 , ⋯   , A n 是 A 中 的 两 两 不 交 的 集 合 } \mathscr{R}=\bigcup_{n=1}^\infty\{\bigcup_{k=1}^nA_k:A_1,\cdots,A_n是\mathscr{A}中的两两不交的集合\} R=n=1{k=1nAk:A1,,AnA} X X X上的环,只要把例1.5中的左开右闭区间换成 A \mathscr{A} A中的抽象集合即可

所谓集系的生成,即从简单集系得到复杂集系, A \mathscr{A} A是一个 X X X的简单集系,它未必对集合的某些运算封闭,但我们要求找到一个 X X X的集系 R \mathscr{R} R,它对某些运算封闭,并且 A ⊆ R \mathscr{A}\subseteq \mathscr{R} AR。不仅如此,我们还希望 R \mathscr{R} R是最小的,一些多余的集合排除出 R \mathscr{R} R。这就是集系生成的概念。

定义1.2 A \mathscr{A} A X X X的集系,如果 X X X的环(单调系、 λ \lambda λ系、 σ \sigma σ代数) R \mathscr{R} R满足:
(1) A ⊂ R \mathscr{A}\subset \mathscr{R} AR
(2)如果 X X X的环(单调系、 λ \lambda λ系、 σ \sigma σ代数) F \mathscr{F} F也满足 A ⊂ F \mathscr{A}\subset \mathscr{F} AF,则 R ⊂ F \mathscr{R}\subset \mathscr{F} RF
则称 F \mathscr{F} F是由 A \mathscr{A} A生成的环(单调系、 λ \lambda λ系、 σ \sigma σ代数),记为 r ( A ) ( m ( A ) , λ ( A ) , σ ( A ) ) r(\mathscr{A})(m(\mathscr{A}),\lambda(\mathscr{A}),\sigma(\mathscr{A})) r(A)(m(A),λ(A),σ(A))

那么我们首先要问的是存在性

定理1.2 对任意 X X X的集系 A \mathscr{A} A,由 A \mathscr{A} A生成的环(单调系、 λ \lambda λ系, σ \sigma σ系)存在

证:我们仅证明存在任意集系生成的环,单调系, λ \lambda λ系和 σ \sigma σ系的证明是类似的。
S \mathcal{S} S为全体包含 A \mathscr{A} A的环的集合,当然 S \mathcal{S} S非空,令 R = ⋂ B ∈ S B \mathscr{R}=\bigcap_{\mathscr{B}\in\mathcal{S}}\mathscr{B} R=BSB容易验证 R \mathscr{R} R是环,且对任意的 B ∈ S \mathscr{B}\in\mathcal{S} BS,由构造显然有 R ⊆ B \mathscr{R}\subseteq \mathscr{B} RB

例1.7 A \mathscr{A} A X X X的半环,则 r ( A ) r(\mathscr{A}) r(A)是例1.6构造的集合,即 r ( A ) = ⋃ n = 1 ∞ { ⋃ k = 1 n A k : A 1 , ⋯   , A n 是 A 中 的 两 两 不 交 的 集 合 } r(\mathscr{A})=\bigcup_{n=1}^\infty\{\bigcup_{k=1}^nA_k:A_1,\cdots,A_n是\mathscr{A}中的两两不交的集合\} r(A)=n=1{k=1nAk:A1,,AnA}这由生成的环的定义可以直接验证

集合形式的单调类定理

下面我们证明一个重要的定理

定理1.3 (1) R \mathscr{R} R X X X上的代数,则 σ ( R ) = m ( R ) \sigma(\mathscr{R})=m(\mathscr{R}) σ(R)=m(R)
(2) P \mathscr{P} P X X X上的 π \pi π系,则 σ ( P ) = λ ( P ) \sigma(\mathscr{P})=\lambda(\mathscr{P}) σ(P)=λ(P)

证:
(1)(2)的证明是类似的,因此我们只证明(1),(2)的证明可以仿照(1)进行
由于所有 σ \sigma σ代数都是单调系,因此, m ( R ) ⊂ σ ( R ) m(\mathscr{R})\subset\sigma(\mathscr{R}) m(R)σ(R),只要证明 σ ( R ) ⊂ m ( R ) \sigma(\mathscr{R})\subset m(\mathscr{R}) σ(R)m(R),实际上,由定理1.1,我们只要验证 m ( R ) m(\mathscr{R}) m(R)是代数即可。首先由于 R ⊂ m ( R ) \mathscr{R}\subset m(\mathscr{R}) Rm(R),并且 R \mathscr{R} R是代数,故 X ∈ m ( R ) X\in m(\mathscr{R}) Xm(R),其次,我们需要验证 m ( R ) m(\mathscr{R}) m(R)对有限并和差运算封闭。对于任意的 A ∈ R A\in \mathscr{R} AR,定义: S ( A ) = { B ∈ m ( R ) : A ∪ B ∈ m ( R ) } \mathscr{S}(A)=\{B\in m(\mathscr{R}):A\cup B\in m(\mathscr{R})\} S(A)={Bm(R):ABm(R)}如果 A ∈ m ( R ) A\in m(\mathscr{R}) Am(R),那么显然,由于 R \mathscr{R} R是一个代数,就有 R ⊂ S ( A ) \mathscr{R}\subset \mathscr{S}(A) RS(A)其次,由于 m ( R ) m(\mathscr{R}) m(R)是单调系,容易验证 S ( A ) \mathscr{S}(A) S(A)也是单调系(按定义验证即可),因此就有 m ( R ) ⊂ S ( A ) m(\mathscr{R})\subset \mathscr{S}(A) m(R)S(A)这说明对任意的 A ∈ m ( R ) A\in m(\mathscr{R}) Am(R),有 R ⊂ S ( A ) \mathscr{R}\subset \mathscr{S}(A) RS(A) S ( A ) \mathscr{S}(A) S(A)是单调系,故 m ( R ) ⊂ S ( A ) m(\mathscr{R})\subset \mathscr{S}(A) m(R)S(A)从而就证得了 m ( R ) m(\mathscr{R}) m(R)对有限并封闭,同理可证 m ( R ) m(\mathscr{R}) m(R)对差运算封闭,故 m ( R ) m(\mathscr{R}) m(R)是代数,因此 m ( R ) m(\mathscr{R}) m(R) σ \sigma σ代数,因此, σ ( R ) ⊂ m ( R ) \sigma(\mathscr{R})\subset m(\mathscr{R}) σ(R)m(R),故 σ ( R ) = m ( R ) \sigma(\mathscr{R})=m(\mathscr{R}) σ(R)=m(R)

定理1.3是证明中非常实用的定理,比如我们证明了在一个代数 R \mathscr{R} R上的任意集合都满足性质 P P P,我们要证明 σ ( R ) \sigma(\mathscr{R}) σ(R)上的所有集合都满足性质 P P P,我们可以直接证明,对满足性质 P P P的任何单调列 { A n } \{A_n\} {An} lim ⁡ n → ∞ A n \displaystyle\lim_{n\to\infty}A_n nlimAn也满足性质 P P P,那么满足性质 P P P的集合构成一个包含 R \mathscr{R} R的单调性,设这个集系为 S \mathscr{S} S,则由定理1.3,就有 σ ( R ) = m ( R ) ⊂ S \sigma(\mathscr{R})=m(\mathscr{R})\subset \mathscr{S} σ(R)=m(R)S σ ( R ) \sigma(\mathscr{R}) σ(R)上所有的集合都满足性质 P P P。我们把以上的思路,整理为下面的很实用的推论

推论1.1 (1) R \mathscr{R} R X X X的代数, S \mathscr{S} S是满足 R ⊂ S \mathscr{R}\subset \mathscr{S} RS的一单调系,则 σ ( R ) ⊂ S \sigma(\mathscr{R})\subset\mathscr{S} σ(R)S
(2) P \mathscr{P} P X X X的一个 π \pi π系, S \mathscr{S} S是满足 P ⊂ S \mathscr{P}\subset \mathscr{S} PS的一 λ \lambda λ系,则 σ ( P ) ⊂ S \sigma(\mathscr{P})\subset\mathscr{S} σ(P)S

这一推论称为集合形式的单调类定理。利用推论1.1进行证明的证明方法称为单调系方法及 λ \lambda λ系方法。

可测空间

可测空间定义

定义1.3 F \mathscr{F} F X X X上的 σ \sigma σ代数,则称二元组 ( X , F ) (X,\mathscr{F}) (X,F)为一个可测空间, F \mathscr{F} F中的集合称为可测集

假设 X X X是一个拓扑空间, O \mathscr{O} O为其拓扑,记 B X = σ ( O ) \mathscr{B}_X=\sigma(\mathscr{O}) BX=σ(O),则 B X \mathscr{B}_X BX X X X的Borel代数或Borel集合系,其中的集合称为 X X X的Borel集,可测空间 ( X , B X ) (X,\mathscr{B}_X) (X,BX)称为拓扑可测空间。现在我们来考察 R R R的Borel代数:

引理1.1 A = { I t : t ∈ T } \mathscr{A}=\{I_t:t\in T\} A={It:tT}是一个由两两不交开区间构成的集系,则 A \mathscr{A} A是可数集

证:
t ∈ T t\in T tT任取有理 q t ∈ I t q_t\in I_t qtIt,由于 A \mathscr{A} A中的开区间两两不交,故对 t 1 , t 2 ∈ T t_1,t_2\in T t1,t2T q t 1 ≠ q t 2 q_{t_1}\neq q_{t_2} qt1=qt2,记 S = { q t : t ∈ T } S=\{q_t:t\in T\} S={qt:tT},则构造映射 φ : A → S I t ↦ q t \begin{aligned} \varphi:&\mathscr{A}&\to &S\\ &I_t&\mapsto&q_t \end{aligned} φ:AItSqt那么显然 φ \varphi φ既是单射,又是满射,并且 S ⊆ Q S\subseteq Q SQ,而 Q Q Q可数,故 A \mathscr{A} A是可数集

定理1.4 R R R上任意开集可表为可数个两两不交的开区间之并

证:
O O O R R R上的开集
①定义生成区间:对任意的 x ∈ O x\in O xO,存在邻域 B ( x , δ ) ⊆ O B(x,\delta)\subseteq O B(x,δ)O,记 S x + = { y > x : ( x , y ) ⊆ O } S x − = { y < x : ( y , x ) ⊆ O } S_x^+=\{y>x:(x,y)\subseteq O\}\\ S_x^{-}=\{y<x:(y,x)\subseteq O\}\\ Sx+={y>x:(x,y)O}Sx={y<x:(y,x)O}显然 S x + S_x^+ Sx+非空,现在,我们规定如果 S x + S_x^+ Sx+无上界,那么显然 ( x , + ∞ ) ⊆ O (x,+\infty)\subseteq O (x,+)O,记 b x = + ∞ b_x=+\infty bx=+,否则,如果 S x + S_x^+ Sx+有上界,记 b x = sup ⁡ y ∈ S x + y \displaystyle b_x=\sup_{y\in S_x^+} y bx=ySx+supy,那么,显然 ( x , b x ) ⊆ O (x,b^x)\subseteq O (x,bx)O,,同样地可以定义 a x a_x ax。开区间 ( a x , b x ) (a_x,b_x) (ax,bx)称为 x x x的生成区间,记为 I x I_x Ix,满足 I x ⊆ O I_x\subseteq O IxO
②对 x ∈ O , y ∈ O x\in O,y\in O xO,yO,则要么 I x = I y I_x=I_y Ix=Iy,要么 I x ∩ I y = ∅ I_x\cap I_y=\emptyset IxIy=,分类讨论即可证得
③由②, A = { I x ∣ x ∈ O } \mathscr{A}=\{I_x|x\in O\} A={IxxO}是两两不交的开区间构成的集合,由引理1.1, A \mathscr{A} A可数,并且 O = ⋃ x ∈ O I x O=\bigcup_{x\in O}I_x O=xOIx

由定理1.4,不难得到 B R = σ { ( a , b ) ∣ a < b , a ≥ − ∞ , b ≤ + ∞ } \mathscr{B}_R=\sigma\{(a,b)|a<b,a\ge -\infty,b\le +\infty\} BR=σ{(a,b)a<b,a,b+}即全体开区间构成的集系生成的 σ \sigma σ代数,这是因为,我们记 F = σ { ( a , b ) : a < b , a ≥ − ∞ , b ≤ + ∞ } \mathscr{F}=\sigma\{(a,b):a<b,a\ge -\infty,b\le +\infty\} F=σ{(a,b):a<b,a,b+},对于任意的开集 O O O,由定理1.4,可知存在 N N N个两两不交的开区间 I 1 , I 2 , ⋯ I_1,I_2,\cdots I1,I2, N N N为有限数或无穷), O = ⋃ k = 1 N I k \displaystyle O=\bigcup_{k=1}^N I_k O=k=1NIk,因此, O ∈ F O\in \mathscr{F} OF(由 σ \sigma σ代数的定义(3)),故由最小 σ \sigma σ代数的定义, B R ⊆ F \mathscr{B}_R\subseteq \mathscr{F} BRF,但是开区间又是开集,故任意开区间又在 B R \mathscr{B}_R BR内,因此 F ⊆ B R \mathscr{F}\subseteq \mathscr{B}_R FBR,从而 F = B R \mathscr{F}=\mathscr{B}_R F=BR

由此还可以得到 B R = σ { ( a , b ) ∣ a < b , a ∈ R , b ∈ R } \mathscr{B}_R=\sigma\{(a,b)|a<b,a\in R,b\in R\} BR=σ{(a,b)a<b,aR,bR} F = σ { ( a , b ) : a < b , a ∈ R , b ∈ R } \mathscr{F}=\sigma\{(a,b):a<b,a\in R,b\in R\} F=σ{(a,b):a<b,aR,bR},那么很显然 F ⊆ B R \mathscr{F}\subseteq \mathscr{B}_R FBR,其次,对任意的 a ∈ R a\in R aR,都有 ( a , + ∞ ) = ⋃ n = 1 ∞ ( a , a + n ) \displaystyle(a,+\infty)=\bigcup_{n=1}^\infty(a,a+n) (a,+)=n=1(a,a+n),故 ( a , + ∞ ) ∈ F (a,+\infty)\in \mathscr{F} (a,+)F,由此可以得到 B R ⊆ F \mathscr{B}_R\subseteq\mathscr{F} BRF,故 F = B R \mathscr{F}=\mathscr{B}_R F=BR

进一步地 B R = σ { ( a , b ] ∣ a < b , a ∈ R , b ∈ R } \mathscr{B}_R=\sigma\{(a,b]|a<b,a\in R,b\in R\} BR=σ{(a,b]a<b,aR,bR}由此可以得到 B R = σ { ( − ∞ , a ) ∣ a ∈ R } \mathscr{B}_R=\sigma\{(-\infty,a)|a\in R\} BR=σ{(,a)aR} ( − ∞ , a ] = ⋂ n = 1 ∞ ( − ∞ , a + 1 n ) \displaystyle(-\infty,a]=\bigcap_{n=1}^\infty (-\infty,a+\frac{1}{n}) (,a]=n=1(,a+n1),由此又可以得到 B R = σ { ( − ∞ , a ] ∣ a ∈ R } = σ { ( − ∞ , a ) ∣ a ∈ R } = σ { ( a , + ∞ ) ∣ a ∈ R } = σ { [ a , + ∞ ) ∣ a ∈ R } \begin{aligned} \mathscr{B}_R=&\sigma\{(-\infty,a]|a\in R\}\\ =&\sigma\{(-\infty,a)|a\in R\}\\ =&\sigma\{(a,+\infty)|a\in R\}\\ =&\sigma\{[a,+\infty)|a\in R\} \end{aligned} BR====σ{(,a]aR}σ{(,a)aR}σ{(a,+)aR}σ{[a,+)aR}
现在我们在实数域 R R R上加上正负无穷 ± ∞ \pm \infty ±两个点,定义广义实数域 R ‾ = R ∪ { + ∞ } ∪ { − ∞ } \overline{R}=R\cup\{+\infty\}\cup\{-\infty\} R=R{+}{}定义运算性质为:
(1) a ∈ R a\in R aR a + ( ± ∞ ) = ± ∞ + a = ± ∞ a+(\pm\infty)=\pm\infty+a=\pm \infty a+(±)=±+a=± a − ( ± ∞ ) = ∓ ∞ a-(\pm\infty)=\mp\infty a(±)=
(2) a ∈ R a\in R aR,则 a . ± ∞ = { ± ∞ a > 0 0 a = 0 ∓ ∞ a < 0 a.\pm\infty=\begin{cases} \pm\infty&a>0\\ 0&a=0\\ \mp\infty&a<0 \end{cases} a.±=±0a>0a=0a<0(3) ( + ∞ ) + ( + ∞ ) = + ∞ (+\infty)+(+\infty)=+\infty (+)+(+)=+ ( − ∞ ) + ( − ∞ ) = − ∞ (-\infty)+(-\infty)=-\infty ()+()=
(4) a ± ∞ = 0 , a ∈ R \frac{a}{\pm\infty}=0,a\in R ±a=0,aR
(5) a ∈ R a\in R aR − ∞ < a < + ∞ -\infty<a<+\infty <a<+
(6) ∣ ± ∞ ∣ = + ∞ |\pm\infty|=+\infty ±=+,由此 a ∈ R a\in R aR等价于 ∣ a ∣ < + ∞ |a|<+\infty a<+
(7) a ± ∞ = 0 , a ∈ R \frac{a}{\pm\infty}=0,a\in R ±a=0,aR
(8) ( + ∞ ) + ( − ∞ ) (+\infty)+(-\infty) (+)+(), ( − ∞ ) + ( + ∞ ) (-\infty)+(+\infty) ()+(+), ± ∞ ± ∞ \frac{\pm\infty}{\pm\infty} ±±等没有意义

定义 R ‾ \overline{R} R上的Borel代数为 B ‾ R = σ ( B R ∪ { + ∞ } ∪ { − ∞ } ) \overline{\mathscr{B}}_R=\sigma(\mathscr{B}_R\cup\{+\infty\}\cup\{-\infty\}) BR=σ(BR{+}{}),那么 { + ∞ } = ⋂ n = 1 ∞ ( n , + ∞ ] { − ∞ } = ⋂ n = 1 ∞ [ − ∞ , − n ) \{+\infty\}=\bigcap_{n=1}^\infty(n,+\infty]\\ \{-\infty\}=\bigcap_{n=1}^\infty[-\infty,-n) {+}=n=1(n,+]{}=n=1[,n)由此不难得到 B ‾ R = σ { [ − ∞ , a ) ∣ a ∈ R } = σ { [ − ∞ , a ] ∣ a ∈ R } = σ { ( a , + ∞ ] ∣ a ∈ R } = σ { [ a , + ∞ ] ∣ a ∈ R } \begin{aligned} \overline{\mathscr{B}}_R=&\sigma\{[-\infty,a)|a\in R\}\\ =&\sigma\{[-\infty,a]|a\in R\}\\ =&\sigma\{(a,+\infty]|a\in R\}\\ =&\sigma\{[a,+\infty]|a\in R\} \end{aligned} BR====σ{[,a)aR}σ{[,a]aR}σ{(a,+]aR}σ{[a,+]aR}

可测映射及可测函数

定义1.4 f f f X X X Y Y Y的映射,对任意的 B ⊆ Y B\subseteq Y BY,定义 f − 1 ( B ) = { x ∈ X ∣ f ( x ) ∈ B } f^{-1}(B)=\{x\in X|f(x)\in B\} f1(B)={xXf(x)B}

定理1.5 f f f X X X Y Y Y的映射,则
(1) f − 1 ( Y ) = X f^{-1}(Y)=X f1(Y)=X
(2) [ f − 1 ( A ) ] c = f − 1 ( A c ) A ⊂ Y [f^{-1}(A)]^c=f^{-1}(A^c)\quad A\subset Y [f1(A)]c=f1(Ac)AY
(3) A ⊂ B ⊂ Y , f − 1 ( A ) ⊂ f − 1 ( B ) A\subset B\subset Y,f^{-1}(A)\subset f^{-1}(B) ABY,f1(A)f1(B)
(4) { B t ∣ t ∈ T } \{B_t|t\in T\} {BttT} Y Y Y上的集系, T T T是指标集 ⋂ t ∈ T f − 1 ( B t ) = f − 1 ( ⋂ t ∈ T B t ) ⋃ t ∈ T f − 1 ( B t ) = f − 1 ( ⋃ t ∈ T B t ) \bigcap_{t\in T} f^{-1}(B_t)=f^{-1}(\bigcap_{t\in T}B_t)\\ \bigcup_{t\in T}f^{-1}(B_t)=f^{-1}(\bigcup_{t\in T}B_t) tTf1(Bt)=f1(tTBt)tTf1(Bt)=f1(tTBt)

Y Y Y上的集系 B \mathscr{B} B,定义 f − 1 ( B ) = { f − 1 ( B ) ∣ B ∈ B } f^{-1}(\mathscr{B})=\{f^{-1}(B)|B\in\mathscr{B}\} f1(B)={f1(B)BB}

定理1.6 f f f X X X Y Y Y的映射, B \mathscr{B} B Y Y Y上的 σ \sigma σ代数,则 σ ( f − 1 B ) = f − 1 ( σ ( B ) ) \sigma(f^{-1}\mathscr{B})=f^{-1}(\sigma(\mathscr{B})) σ(f1B)=f1(σ(B))

证:
首先容易证明 f − 1 ( σ ( B ) ) f^{-1}(\sigma(\mathscr{B})) f1(σ(B))是一个 σ \sigma σ代数,并且 f − 1 B ⊂ f − 1 σ ( B ) f^{-1}\mathscr{B}\subset f^{-1}\sigma(\mathscr{B}) f1Bf1σ(B)(由定理1.5的(3)),从而 σ ( f − 1 B ) ⊂ f − 1 ( σ ( B ) ) \sigma(f^{-1}\mathscr{B})\subset f^{-1}(\sigma(\mathscr{B})) σ(f1B)f1(σ(B)),其次,定义 S = { B ∈ σ ( B ) ∣ f − ( B ) ∈ σ ( f − 1 ( B ) ) } \mathscr{S}=\{B\in \sigma(\mathscr{B})|f^{-}(B)\in\sigma(f^{-1}(\mathscr{B}))\} S={Bσ(B)f(B)σ(f1(B))}不难验证 S \mathscr{S} S是一个 σ \sigma σ代数,因此 σ ( B ) ⊂ S \sigma(\mathscr{B})\subset\mathscr{S} σ(B)S f − 1 ( σ ( B ) ) ⊂ σ ( f − 1 ( B ) ) f^{-1}(\sigma(\mathscr{B}))\subset \sigma(f^{-1}(\mathscr{B})) f1(σ(B))σ(f1(B))因此 f − 1 ( σ ( B ) ) = σ ( f − 1 ( B ) ) f^{-1}(\sigma(\mathscr{B}))= \sigma(f^{-1}(\mathscr{B})) f1(σ(B))=σ(f1(B))

定义1.5 ( X , F X ) (X,\mathscr{F}_X) (X,FX) ( Y , F Y ) (Y,\mathscr{F}_Y) (Y,FY)的两个可测空间, f f f X X X Y Y Y的映射,如果对任意的 B ∈ F Y B\in \mathscr{F}_Y BFY f − 1 ( B ) ∈ F X f^{-1}(B)\in \mathscr{F}_X f1(B)FX,则称 f f f ( X , F X ) (X,\mathscr{F}_X) (X,FX) ( Y , F Y ) (Y,\mathscr{F}_Y) (Y,FY)的可测映射或随机元

我们实际上经常省略写 F X \mathscr{F}_X FX F Y \mathscr{F}_Y FY,直接称 f f f X X X Y Y Y的随机元或可测映射,显然, f f f X X X Y Y Y的随机元或可测映射等价于 f − 1 ( F Y ) ⊆ F X f^{-1}(\mathscr{F}_Y)\subseteq \mathscr{F}_X f1(FY)FX,我们记 σ ( f ) = f − 1 ( F Y ) \sigma(f)=f^{-1}(\mathscr{F}_Y) σ(f)=f1(FY),显然,对任意的映射 f : X → Y f:X\to Y f:XY σ ( f ) \sigma(f) σ(f) σ \sigma σ代数,如果 f f f可测还是是 F X \mathscr{F}_X FX的子 σ \sigma σ代数,我们从另一个角度看,实际上删去 F X \mathscr{F}_X FX中部分集合,只留下 σ ( f ) \sigma(f) σ(f),还能够使 f f f可测,因而我们称 σ ( f ) \sigma(f) σ(f)是使 f f f可测的最小 σ \sigma σ代数。

假设 F Y = σ ( B ) \mathscr{F}_Y=\sigma(\mathscr{B}) FY=σ(B),则 f f f可测的充要条件是 f − 1 ( B ) ⊂ F X f^{-1}(\mathscr{B})\subset \mathscr{F}_X f1(B)FX

定理1.7 ( X , F X ) (X,\mathscr{F}_X) (X,FX)是可测空间, B \mathscr{B} B Y Y Y上的集系, f f f ( X , F X ) (X,\mathscr{F}_X) (X,FX) ( Y , σ ( B ) ) (Y,\sigma(\mathscr{B})) (Y,σ(B))的可测映射的充要条件是 f − 1 ( B ) ⊂ F X f^{-1}(\mathscr{B})\subset \mathscr{F}_X f1(B)FX

证: f f f X X X Y Y Y的可测映射的充要条件是 f − 1 ( σ ( B ) ) = σ ( f − 1 ( B ) ) ⊂ F X f^{-1}(\sigma(\mathscr{B}))=\sigma(f^{-1}(\mathscr{B}))\subset \mathscr{F}_X f1(σ(B))=σ(f1(B))FX f f f X X X Y Y Y上的可测映射,那么 σ ( f − 1 ( B ) ) ⊂ F X \sigma(f^{-1}(\mathscr{B}))\subset \mathscr{F}_X σ(f1(B))FX显然有 f − 1 ( B ) ⊂ F X f^{-1}(\mathscr{\mathscr{B}})\subset \mathscr{F}_X f1(B)FX,反之,如果 f − 1 ( B ) ⊂ F X f^{-1}(\mathscr{\mathscr{B}})\subset \mathscr{F}_X f1(B)FX,则由最小 σ \sigma σ代数的定义 σ ( f − 1 ( B ) ) ⊂ F X \sigma(f^{-1}(\mathscr{\mathscr{B}}))\subset \mathscr{F}_X σ(f1(B))FX f f f X X X Y Y Y的可测映射

定义1.6 ( X , F X ) (X,\mathscr{F}_X) (X,FX)是一个可测空间,则 ( X , F X ) (X,\mathscr{F}_X) (X,FX) ( R ‾ , B ‾ R ) (\overline{R},\overline{\mathscr{B}}_R) (R,BR)的可测映射 f f f称为 ( X , F X ) (X,\mathscr{F}_X) (X,FX)上的可测函数, ( X , F X ) (X,\mathscr{F}_X) (X,FX) ( R , B R ) (R,\mathscr{B}_R) (R,BR)的可测映射称为 ( X , F X ) (X,\mathscr{F}_X) (X,FX)上的随机变量

按照可测函数和随机变量的定义, f f f可测与否取决于 F X \mathscr{F}_X FX,对于映射 f : X → R ‾ f:X\to \overline{R} f:XR,如果 f f f ( X , F X ) (X,\mathscr{F}_X) (X,FX)上的可测函数,我们还可以称为 f f f关于 F X \mathscr{F}_X FX可测,同理,对一般的函数 f : X → R f:X\to R f:XR f f f ( X , F X ) (X,\mathscr{F}_X) (X,FX)上的随机变量,我们还可以称为 f f f关于 F X \mathscr{F}_X FX可测。

R R R上的Borel代数和广义Borel代数的定义,再由定理1.6,我们可以得到判断函数可测与否的一个比较方便的条件:

定理1.8 f f f X X X R ‾ ( R ) \overline{R}(R) R(R)的函数,则 f f f关于 F X \mathscr{F}_X FX可测具有以下的充要条件:
(1)对任意的 a ∈ R a\in R aR f − 1 [ − ∞ , a ) ∈ F X f^{-1}[-\infty,a)\in\mathscr{F}_X f1[,a)FX f − 1 ( − ∞ , a ) ∈ F X f^{-1}(-\infty,a)\in\mathscr{F}_X f1(,a)FX
(2)对任意的 a ∈ R a\in R aR f − 1 [ − ∞ , a ] ∈ F X f^{-1}[-\infty,a]\in\mathscr{F}_X f1[,a]FX f − 1 ( − ∞ , a ] ∈ F X f^{-1}(-\infty,a]\in\mathscr{F}_X f1(,a]FX
(3)对任意的 a ∈ R a\in R aR f − 1 ( a , + ∞ ] ∈ F X f^{-1}(a,+\infty]\in\mathscr{F}_X f1(a,+]FX f − 1 ( a , + ∞ ) ∈ F X f^{-1}(a,+\infty)\in\mathscr{F}_X f1(a,+)FX
(4)对任意的 a ∈ R a\in R aR f − 1 [ a , + ∞ ] ∈ F X f^{-1}[a,+\infty]\in\mathscr{F}_X f1[a,+]FX f − 1 [ a , + ∞ ) ∈ F X f^{-1}[a,+\infty)\in\mathscr{F}_X f1[a,+)FX

处于方便考虑,后面所有的 X X X上的 σ \sigma σ代数都默认为 F X \mathscr{F}_X FX,我们称 f f f X X X上的可测函数或随机变量,就是说 f f f关于 F X \mathscr{F}_X FX可测

定理1.9(可测函数的运算)
(1) f f f是可测函数, a ∈ R ‾ a\in\overline{R} aR,则 a f af af是可测函数
(2) f , g f,g f,g是可测函数, f + g f+g f+g处处有意义,则 f + g f+g f+g是可测函数
(3) f , g f,g f,g是可测函数, f g fg fg是可测函数
(4) f , g f,g f,g是可测函数, f g \frac{f}{g} gf处处有意义, f g \frac{f}{g} gf是可测函数

定理1.10(随机变量的运算)
(1) f , g f,g f,g是随机变量,则对任意的实数 a , b ∈ R a,b\in R a,bR a f + b g af+bg af+bg也是随机变量
(2) f , g f,g f,g是随机变量,则 f g fg fg也是随机变量
(3) f , g f,g f,g是随机变量, g ≠ 0 g\neq 0 g=0,则 f g \frac{f}{g} gf是随机变量

下面来证明定理1.9:

定理1.9的证明:仅证明(1)(2),(3)(4)的证明可类似进行
(1)若 a = + ∞ a=+\infty a=+,首先,令 g ( x ) = ( + ∞ ) . f ( x ) g(x)=(+\infty).f(x) g(x)=(+).f(x),则 g ( x ) = { + ∞ x ∈ f − 1 ( − ∞ , + ∞ ] − ∞ x ∈ f − 1 { − ∞ } g(x)=\begin{cases} +\infty&x\in f^{-1}(-\infty,+\infty]\\ -\infty&x\in f^{-1}\{-\infty\} \end{cases} g(x)={+xf1(,+]xf1{}因此,对任意的 b ∈ R b\in R bR,都有 { x : g ( x ) ≤ b } = f − 1 { − ∞ } = ⋂ n = 1 ∞ f − 1 [ − ∞ , − n ] ∈ F X \{x:g(x)\le b\}=f^{-1}\{-\infty\}=\bigcap_{n=1}^\infty f^{-1}[-\infty,-n]\in\mathscr{F}_X {x:g(x)b}=f1{}=n=1f1[,n]FX g ( x ) g(x) g(x)可测,同理可证 a = − ∞ a=-\infty a=时, a f af af也可测
假设 ∣ a ∣ < + ∞ |a|<+\infty a<+,先设 a > 0 a>0 a>0 g ( x ) = a f ( x ) g(x)=af(x) g(x)=af(x),则 g ( x ) = { + ∞ x ∈ f − 1 { + ∞ } a f ( x ) x ∈ f − 1 R − ∞ x ∈ f − 1 { − ∞ } g(x)=\begin{cases} +\infty&x\in f^{-1}\{+\infty\}\\ af(x)&x\in f^{-1}R\\ -\infty&x\in f^{-1}\{-\infty\} \end{cases} g(x)=+af(x)xf1{+}xf1Rxf1{}对任意的 b ∈ R b\in R bR,都有 { x : g ( x ) ≤ b } = f − 1 [ − ∞ , b a ] ∈ F X \{x:g(x)\le b\}=f^{-1}[-\infty,\frac{b}{a}]\in\mathscr{F}_X {x:g(x)b}=f1[,ab]FX(2) h ( x ) = f ( x ) + g ( x ) h(x)=f(x)+g(x) h(x)=f(x)+g(x),则记 A 1 = ( f − 1 { + ∞ } ∩ g − 1 ( − ∞ , + ∞ ] ) ∪ ( f − 1 R ∩ g − 1 { + ∞ } ) A 2 = f − 1 R ∩ g − 1 R A 3 = ( f − 1 { − ∞ } ∩ g − 1 [ − ∞ , + ∞ ) ) ∩ ( f − 1 R ∩ g − 1 { − ∞ } ) A_1=(f^{-1}\{+\infty\}\cap g^{-1}(-\infty,+\infty])\cup (f^{-1}R\cap g^{-1}\{+\infty\})\\ A_2=f^{-1}R\cap g^{-1}R\\ A_3=(f^{-1}\{-\infty\}\cap g^{-1}[-\infty,+\infty))\cap (f^{-1}R\cap g^{-1}\{-\infty\}) A1=(f1{+}g1(,+])(f1Rg1{+})A2=f1Rg1RA3=(f1{}g1[,+))(f1Rg1{}) X = A 1 ∩ A 2 ∩ A 3 X=A_1\cap A_2\cap A_3 X=A1A2A3(因为 f + g f+g f+g处处有意义), A 1 , A 2 , A 3 ∈ F X A_1,A_2,A_3\in \mathscr{F}_X A1,A2,A3FX,并且 h ( x ) = { + ∞ x ∈ A 1 f ( x ) + g ( x ) x ∈ A 2 − ∞ x ∈ A 3 h(x)=\begin{cases} +\infty&x\in A_1\\ f(x)+g(x)&x\in A_2\\ -\infty&x\in A_3 \end{cases} h(x)=+f(x)+g(x)xA1xA2xA3对于任意的 b ∈ R b\in R bR,就有 { x : h ( x ) < b } = { x : f ( x ) + g ( x ) < b , x ∈ A 2 } ∪ A 3 \{x:h(x)< b\}=\{x:f(x)+g(x)< b,x\in A_2\}\cup A_3 {x:h(x)<b}={x:f(x)+g(x)<b,xA2}A3只要证明 { x : f ( x ) + g ( x ) < b , x ∈ A 2 } ∈ F X \{x:f(x)+g(x)< b,x\in A_2\}\in\mathscr{F}_X {x:f(x)+g(x)<b,xA2}FX我们记全体有理数为 { q n , n = 1 , 2 , ⋯   } \{q_n,n=1,2,\cdots\} {qn,n=1,2,},实际上就有 { x : f ( x ) + g ( x ) < b , x ∈ A 2 } = ⋃ n = 1 ∞ f − 1 ( − ∞ , q n ) ∩ g − 1 ( − ∞ , b − q n ) \{x:f(x)+g(x)< b,x\in A_2\}=\bigcup_{n=1}^\infty f^{-1}(-\infty,q_n)\cap g^{-1}(-\infty,b-q_n) {x:f(x)+g(x)<b,xA2}=n=1f1(,qn)g1(,bqn)我们记 B = ⋃ n = 1 ∞ f − 1 ( − ∞ , q n ) ∩ g − 1 ( − ∞ , b − q n ) \displaystyle B=\bigcup_{n=1}^\infty f^{-1}(-\infty,q_n)\cap g^{-1}(-\infty,b-q_n) B=n=1f1(,qn)g1(,bqn),那么对任意的 x ∈ B x\in B xB,存在 n 0 n_0 n0 f ( x ) ∈ ( − ∞ , q n 0 ) f(x)\in(-\infty,q_{n_0}) f(x)(,qn0) g ( x ) ∈ ( − ∞ , b − q n 0 ) g(x)\in(-\infty,b-q_{n_0}) g(x)(,bqn0),这说明了 f ( x ) , g ( x ) f(x),g(x) f(x),g(x)都是实数,并且, f ( x ) < q n 0 , g ( x ) < b − q n 0 f(x)< q_{n_0},g(x)< b-q_{n_0} f(x)<qn0,g(x)<bqn0,从而 f ( x ) + g ( x ) < b f(x)+g(x)< b f(x)+g(x)<b,故 x ∈ { x : f ( x ) + g ( x ) < b , x ∈ A 2 } x\in \{x:f(x)+g(x)< b,x\in A_2\} x{x:f(x)+g(x)<b,xA2}
反之,对 x ∈ { x : f ( x ) + g ( x ) < b , x ∈ A 2 } x\in \{x:f(x)+g(x)< b,x\in A_2\} x{x:f(x)+g(x)<b,xA2},首先, f ( x ) , g ( x ) f(x),g(x) f(x),g(x)都是实数,其次,假设对任意的 n ≥ 1 n\ge 1 n1,如果 f ( x ) < q n f(x)< q_n f(x)<qn,都有 g ( x ) ≥ b − q n g(x)\ge b-q_n g(x)bqn,那么 g ( x ) + q n ≥ b g(x)+q_n\ge b g(x)+qnb取一列有理数 { q n k } \{q_{n_k}\} {qnk},满足 q n k > f ( x ) , k = 1 , 2 , ⋯ q_{n_k}>f(x),k=1,2,\cdots qnk>f(x),k=1,2,,同时 lim ⁡ k → ∞ q n k = f ( x ) \displaystyle\lim_{k\to\infty}q_{n_k}=f(x) klimqnk=f(x),就有 g ( x ) + q n k ≥ b g(x)+q_{n_k}\ge b g(x)+qnkb上式令 k → ∞ k\to\infty k,则 g ( x ) + f ( x ) ≥ b g(x)+f(x)\ge b g(x)+f(x)b g ( x ) + f ( x ) < b g(x)+f(x)<b g(x)+f(x)<b矛盾,因此 x ∈ ⋃ n = 1 ∞ f − 1 ( − ∞ , q n ) ∩ g − 1 ( − ∞ , b − q n ) \displaystyle x\in \bigcup_{n=1}^\infty f^{-1}(-\infty,q_n)\cap g^{-1}(-\infty,b-q_n) xn=1f1(,qn)g1(,bqn),这就证得了 { x : f ( x ) + g ( x ) < b , x ∈ A 2 } = ⋃ n = 1 ∞ f − 1 ( − ∞ , q n ) ∩ g − 1 ( − ∞ , b − q n ) ∈ F X \{x:f(x)+g(x)< b,x\in A_2\}=\bigcup_{n=1}^\infty f^{-1}(-\infty,q_n)\cap g^{-1}(-\infty,b-q_n)\in \mathscr{F}_X {x:f(x)+g(x)<b,xA2}=n=1f1(,qn)g1(,bqn)FX从而 f + g f+g f+g可测

将随机变量视为一种特殊的可测函数,再由定理1.9,就可以得到定理1.10

定理1.11(可测函数对极限运算的封闭性)
(1) { f n } \{f_n\} {fn}是可测函数列,则 sup ⁡ n ≥ 1 f n ( x ) , inf ⁡ n ≥ 1 f n ( x ) \displaystyle\sup_{n\ge 1}f_n(x),\inf_{n\ge 1}f_n(x) n1supfn(x),n1inffn(x)是可测函数
(2) { f n } \{f_n\} {fn}是可测函数列,则 lim sup ⁡ n → ∞ f n ( x ) , lim inf ⁡ n → ∞ f n ( x ) \displaystyle \limsup_{n\to\infty}f_n(x),\liminf_{n\to\infty}f_n(x) nlimsupfn(x),nliminffn(x)是可测函数,特别地,如果 lim ⁡ n → ∞ f n ( x ) \displaystyle\lim_{n\to\infty}f_n(x) nlimfn(x)处处存在(这里的存在指的是广义收敛),则 lim ⁡ n → ∞ f n ( x ) \displaystyle\lim_{n\to\infty}f_n(x) nlimfn(x)是可测函数

证:
仅证明(1),(2)是(1)的直接推论,实际上,对任意的实数 b b b
{ sup ⁡ n ≥ 1 f n ( x ) ≤ b } = ⋂ n = 1 ∞ f n − 1 [ − ∞ , b ] \{\sup_{n\ge 1}f_n(x)\le b\}=\bigcap_{n=1}^\infty f^{-1}_n[-\infty,b] {n1supfn(x)b}=n=1fn1[,b]
f n − 1 [ − ∞ , b ] ∈ F X f_n^{-1}[-\infty,b]\in\mathscr{F}_X fn1[,b]FX,故 { sup ⁡ n ≥ 1 f n ( x ) ≤ b } ∈ F X \{\sup_{n\ge 1}f_n(x)\le b\}\in \mathscr{F}_X {n1supfn(x)b}FX因此 sup ⁡ n ≥ 1 f n ( x ) \displaystyle\sup_{n\ge 1}f_n(x) n1supfn(x)是可测函数,而 inf ⁡ n ≥ 1 f n ( x ) = − sup ⁡ n ≥ 1 [ − f n ( x ) ] \inf_{n\ge 1}f_n(x)=-\sup_{n\ge 1}[-f_n(x)] n1inffn(x)=n1sup[fn(x)] sup ⁡ n ≥ 1 [ − f n ( x ) ] \displaystyle \sup_{n\ge 1}[-f_n(x)] n1sup[fn(x)]是可测函数,由定理1.10, inf ⁡ n ≥ 1 f n ( x ) \displaystyle\inf_{n\ge 1}f_n(x) n1inffn(x)也是可测函数

我们先给出可测映射对复合的封闭性

定理1.12 f f f ( X , F X ) (X,\mathscr{F}_X) (X,FX) ( Y , F Y ) (Y,\mathscr{F}_Y) (Y,FY)的可测映射, g g g ( Y , F Y ) (Y,\mathscr{F}_Y) (Y,FY) ( Z , F Z ) (Z,\mathscr{F}_Z) (Z,FZ)的可测映射,则 g ∘ f g\circ f gf ( X , F X ) (X,\mathscr{F}_X) (X,FX) ( Z , F Z ) (Z,\mathscr{F}_Z) (Z,FZ)的可测映射

这由定义是比较容易验证的,这里就不证明了

由此,我们可以引入一类特殊的函数,我们称 ( R ‾ , B ‾ R ) (\overline{R},\overline{\mathscr{B}}_R) (R,BR)上的可测函数为定义在广义实数域上的Borel可测函数, ( R , B R ) (R,\mathscr{B}_R) (R,BR)上的可测函数为Borel可测函数, ( R ‾ , B ‾ R ) (\overline{R},\overline{\mathscr{B}}_R) (R,BR)上的随机变量为定义在广义实数域上的有限值Borel可测函数, ( R , B R ) (R,\mathscr{B}_R) (R,BR)上的随机变量为有限值Borel可测函数,以上函数都可统称为Borel可测函数,具体的定义域和值域视场景而定,那么由定理1.12,不难看出

定理1.13 f f f X X X上的可测函数(随机变量), g g g是定义在广义实数域上的Borel可测函数(有限值Borel函数),则 g ∘ f g\circ f gf X X X上的可测函数(随机变量)

例1.8 R R R上的连续函数(任意开集的原象还是开集)及单调函数(直接由定义就可以验证)都是Borel可测函数,因而可测函数和连续函数以及单调函数的复合

函数形式的单调类定理

A 1 , A 2 , ⋯   , A n A_1,A_2,\cdots,A_n A1,A2,,An两两不交,并且 X = ⋃ k = 1 n A k \displaystyle X=\bigcup_{k=1}^nA_k X=k=1nAk,则称 { A 1 , ⋯   , A n } \{A_1,\cdots,A_n\} {A1,,An} X X X的一个有限分割,如果这 n n n个集合都是可测集,则称 { A 1 , ⋯   , A n } \{A_1,\cdots,A_n\} {A1,,An} X X X的一个有限可测分割,如果对函数 f : X → R f:X\to R f:XR,存在 X X X的有限可测分割 { A 1 , ⋯   , A n } \{A_1,\cdots,A_n\} {A1,,An},使得 f f f可表为 f = ∑ k = 1 n a k I A k f=\sum_{k=1}^na_kI_{A_k} f=k=1nakIAk其中 I A k I_{A_k} IAk A k A_k Ak的特征函数,容易验证:任何可测集的特征函数都是可测函数,因此, f f f也是可测函数,同时还是有限值的可测函数,即随机变量。

下面我们证明:任何的可测函数都可以被渐升的简单函数列逼近:

定理1.14 f f f X X X上的可测函数,则
(1) 如果 f f f X X X上的非负可测函数,则存在渐升的简单函数列 { h n } \{h_n\} {hn} { h n } \{h_n\} {hn} X X X上逐点收敛到 f f f,如果 f f f是有界的,收敛是一致的
(2) 如果 f f f X X X上的可测函数,则存在简单函数列 { h n } \{h_n\} {hn},满足 ∣ h 1 ( x ) ∣ ≤ ∣ h 2 ( x ) ∣ ≤ ∣ h 3 ( x ) ∣ ≤ ⋯ ∀ x ∈ X |h_1(x)|\le |h_2(x)|\le |h_3(x)|\le \cdots\quad \forall x\in X h1(x)h2(x)h3(x)xX X X X上收敛到 f f f,并且如果 f f f是有界的,收敛是一致的

这一定理的证明是相当直观的,我们来看如何构造这样的 { h n } \{h_n\} {hn},假设 f f f是非负可测函数
在这里插入图片描述
在这里插入图片描述
在0到 1 2 \frac{1}{2} 21之间的都指定为0, 1 2 \frac{1}{2} 21到1之间的指定为 1 2 \frac{1}{2} 21,大于1的指定为1。为了更逼近f,采取的策略是进行进一步的细分,对原有的0- 1 2 \frac{1}{2} 21 1 2 \frac{1}{2} 21-1进行二等分,进一步地,还对1-2进行四等分,每个区间取最小值作为 h 2 h_2 h2的值,< 则是对原有的区间继续进行二等分,对2-3进行八等分,每个区间取最小值作为 h 3 h_3 h3的值,以此类推。从几何直观来看,构造的 { h n } \{h_n\} {hn}是非负渐升的,并且和 f f f的误差会越来越小,从而逼近 f f f

定理1.14的证明:
证:(1)令 h n = ∑ i = 0 n . 2 n − 1 i 2 n I { x : i 2 n ≤ f ( x ) < i + 1 2 n } + n . I { x : f ( x ) ≥ n } \displaystyle h_n=\sum_{i=0}^{n.2^n-1}{\frac{i}{2^n}I_{\{x:\frac{i}{2^n}\le f\left(x\right)<\frac{i+1}{2^n}\}}}+n.I_{\{x:f\left(x\right)\geq n\}} hn=i=0n.2n12niI{x:2nif(x)<2ni+1}+n.I{x:f(x)n}
由构造,容易验证 { h n } \{h_n\} {hn}是非负渐升的简单函数列,并且,如果 f ( x ) < + ∞ f\left(x\right)<+\infty f(x)<+,存在 N N N f ( x ) < N f\left(x\right)<N f(x)<N n ≥ N n\geq N nN ∣ f ( x ) − h n ( x ) ∣ ≤ 1 2 n \left|f\left(x\right)-h_n\left(x\right)\right|\le\frac{1}{2^n} f(x)hn(x)2n1
如果 f ( x ) = + ∞ f\left(x\right)=+\infty f(x)=+,那么 h n ( x ) = n ↑ + ∞ = f ( x ) h_n\left(x\right)=n\uparrow+\infty=f\left(x\right) hn(x)=n+=f(x)
由上面的分析也容易知道,如果 f ( x ) f\left(x\right) f(x)有界,收敛是一致的。
(2)将 f f f分解为 f = f + − f − f=f^+-f^- f=f+f,其中 f + = f . I { x : f ( x ) > 0 } f − = − f . I { x : f ( x ) ≤ 0 } f^+=f.I_{\{x:f\left(x\right)>0\}}\\ f^-=-f.I_{\{x:f\left(x\right)\le0\}} f+=f.I{x:f(x)>0}f=f.I{x:f(x)0} f + f^+ f+ f − f^- f分别使用(1)的结论即可

简单函数逼近定理为证明有关可测函数的命题提供了一个非常有用的方法——典型方法。
(1)先证明对任意的 E ∈ F E\in\mathscr{F} EF,命题对 I E I_E IE成立
(2)再证明命题对线性组合是封闭的,从而命题对非负简单函数成立
(3)接下来证明命题对非负渐升列是封闭的,从而证明命题对非负可测函数是封闭的
(4)对一般的可测函数,将其分解为正负部,从而证明命题对一般可测函数是封闭的。
以上方法称为 典 型 方 法 ‾ \underline{典型方法} ,由以上典型方法可以证明测度论中大量的命题。

下面我们给出函数形式的单调类定理,这实际上是把典型方法称一个有关函数类的定理。

定理1.15 P \mathscr{P} P是一个 π \pi π系, L \mathscr{L} L是一个由 X X X上的非负广义实值函数组成的 λ \lambda λ类,即它是由 X X X上具有下列性质的非负广义实值函数组成的集合:
(1) 1 ∈ L 1\in\mathscr{L} 1L
(2)对任意的 f , g ∈ L f,g\in\mathscr{L} f,gL α , β ∈ R \alpha,\beta\in R α,βR,只要 α f + β g \alpha f+\beta g αf+βg处处有意义,并且 α f + β g ≥ 0 \alpha f+\beta g\ge 0 αf+βg0,则 α f + β g ∈ L \alpha f+\beta g\in\mathscr{L} αf+βgL(3)对任意的 f n ∈ L , n = 1 , 2 , ⋯ f_n\in\mathscr{L},n=1,2,\cdots fnL,n=1,2,,如果 f n ↑ f f_n\uparrow f fnf,则 f ∈ L f\in\mathscr{L} fL
如果 P \mathscr{P} P中的集合的特征函数都在 M \mathscr{M} M内,则 ( X , σ ( P ) ) (X,\sigma(\mathscr{P})) (X,σ(P))上所有的非负可测函数都在 L \mathscr{L} L

证:
定义 S = { A ⊂ X : I A ∈ L } \mathscr{S}=\{A\subset X:I_A\in\mathscr{L}\} S={AX:IAL},则由 ( 1 ) (1) (1),有 X ∈ S X\in\mathscr{S} XS,如果 A ∈ S , B ∈ S , A ⊂ B A\in \mathscr{S},B\in\mathscr{S},A\subset B AS,BS,AB,则 I B − I A = I B − A ≥ 0 I_B-I_A=I_{B-A}\ge 0 IBIA=IBA0则由 ( 2 ) (2) (2) I B − A ∈ L I_{B-A}\in\mathscr{L} IBAL B − A ∈ F B-A\in \mathscr{F} BAF,如果 A n ↑ A , A n ∈ S , n = 1 , 2 , ⋯ A_n\uparrow A,A_n\in\mathscr{S},n=1,2,\cdots AnA,AnS,n=1,2,,则 I A n ∈ L , n = 1 , 2 , ⋯   , I A n ↑ I A I_{A_n}\in\mathscr{L},n=1,2,\cdots,I_{A_n}\uparrow I_{A} IAnL,n=1,2,,IAnIA,再由 ( 3 ) (3) (3) I A ∈ L , A ∈ S I_A\in\mathscr{L},A\in\mathscr{S} IAL,AS,故 σ ( P ) ⊂ S \sigma(\mathscr{P})\subset \mathscr{S} σ(P)S,由(2),可得所有简单函数都在 L \mathscr{L} L内,再由简单函数逼近定理,所有非负可测函数都在 L \mathscr{L} L

用典型方法还可以证明如下定理:

定理1.16 g g g ( X , F X ) (X,\mathscr{F}_X) (X,FX) ( Y , F Y ) (Y,\mathscr{F}_Y) (Y,FY)的随机元, h h h ( X , σ ( g ) ) (X,\sigma(g)) (X,σ(g))上的可测函数(随机变量)的充要条件是存在 ( Y , F Y ) (Y,\mathscr{F}_Y) (Y,FY)上的可测函数(随机变量) f f f,使得 h = f ∘ g h=f\circ g h=fg

证:
充分性是显然的,只要证必要性即可。
对任意的 A ∈ σ ( g ) A\in\sigma(g) Aσ(g),存在 B ∈ F Y B\in\mathscr{F}_Y BFY A = g − 1 B A=g^{-1}B A=g1B,对 h = I A h=I_A h=IA,定义 f = I B f=I_B f=IB,则 f ( g ( x ) ) = { 1 g ( x ) ∈ B 0 g ( x ) ∉ B f(g(x))=\begin{cases} 1&g(x)\in B\\ 0&g(x)\notin B \end{cases} f(g(x))={10g(x)Bg(x)/B g ( x ) ∈ B g(x)\in B g(x)B等价 x ∈ g − 1 B x\in g^{-1}B xg1B,故 f ( g ( x ) ) = { 1 x ∈ g − 1 ( B ) 0 x ∉ g − 1 ( B ) = I g − 1 B = I A f(g(x))=\begin{cases} 1&x\in g^{-1}(B)\\ 0&x\notin g^{-1}(B) \end{cases}=I_{g^{-1}B}=I_A f(g(x))={10xg1(B)x/g1(B)=Ig1B=IA同时,函数类 L \mathscr{L} L是全体 ( X , σ ( g ) ) (X,\sigma(g)) (X,σ(g))上的可测函数(随机变量) f f f,要求满足存在 ( Y , F Y ) (Y,\mathscr{F}_Y) (Y,FY)上的可测函数(随机变量) f f f,使得 h = f ∘ g h=f\circ g h=fg,容易验证 L \mathscr{L} L对线性运算封闭,对单调增极限封闭,由典型方法即可证明任意的非负可测函数都在 L \mathscr{L} L上,由于 L \mathscr{L} L对线性运算封闭,将任意可测函数(随机变量)分别为正负部之差,即可证得所有的可测函数(随机变量)都在 L \mathscr{L} L内,即证得必要性

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值