本节为概率论与数理统计复习笔记的第三部分,一维随机变量及其分布,主要包括:分布函数的定义、两类随机变量及其常见的分布类型,包括0-1分布,二项分布,几何分布,泊松分布,超几何分布,均匀分布,指数分布以及正态分布。
1. 分布函数
设 X X X是随机变量, x x x是任意函数,称函数 F ( x ) = P { X ≤ x } ( x ∈ R ) F(x)=P\{X\leq x\}(x\in R) F(x)=P{X≤x}(x∈R)为随机变量 X X X的分布函数,或称 X X X服从分布 F ( x ) F(x) F(x),记为 X ∼ F ( x ) X\sim F(x) X∼F(x)。其中 x x x取遍 ( − ∞ , ∞ ) (-\infty,\infty) (−∞,∞), P P P也从0变为1。
F ( x ) F(x) F(x)有几个重要的性质:
- 单调不减函数
- 右连续函数,即 l i m x → x 0 + F ( x ) = F ( x 0 + 0 ) = F ( x 0 ) lim_{x\rightarrow x_0^+}F(x)=F(x_0+0)=F(x_0) limx→x0+F(x)=F(x0+0)=F(x0)
- F ( − ∞ ) = l i m x → − ∞ F ( x ) = 0 ; F ( + ∞ ) = 1 F(-\infty)=lim_{x\rightarrow-\infty}F(x)=0;F(+\infty)=1 F(−∞)=limx→−∞F(x)=0;F(+∞)=1
2. 常见的两类随机变量
即离散型和连续型。前者 X X X有有限个或可列个值。对于连续型,若随机变量 X X X的分布函数可表示为 F ( x ) = ∫ − ∞ x f ( t ) d t ( x ∈ R ) F(x)=\int_{-\infty}^{x}f(t)dt(x\in R) F(x)=∫−∞xf(t)dt(x∈R),其中 f ( x ) f(x) f(x)是非负可积函数,则称 X X X为连续型随机变量。 f ( x ) f(x) f(x)为 X X X的概率密度函数,记为 X ∼ f ( x ) X\sim f(x) X∼f(x)。【 f ( x ) f(x) f(x)为某一随机变量的概率密度的充要条件是 f ( x ) ≥ 0 且 ∫ − ∞ ∞ f ( x ) d x = 1 f(x)\geq 0且\int_{-\infty}^{\infty}f(x)dx=1 f(x)≥0且∫−∞∞f(x)dx=1】
离题小知识:事件 A A A为空集可以得出 A A A发生的概率为0,但是反过来却不成立。比如几何概型中的一个点,属于测不准。
3. 常见随机变量分布类型
3.1. 离散型
伯努利分布的三种情况
- “1”: 0-1分布: X ∼ B ( 1 , p ) X\sim B(1,p) X∼B(1,p),[ P { X = k } = p k ( 1 − p ) k − 1 , k = 0 , 1 P\{X=k\}=p^k(1-p)^{k-1},k=0,1 P{X=k}=pk(1−p)k−1,k=0,1]
- “n”:二项分布: X ∼ B ( n , p ) X\sim B(n,p) X∼B(n,p),[ P { X = k } = C n k p k ( 1 − p ) n − k ) , k = 0 , 1 , . . . , n P\{X=k\}=C_n^kp^k(1-p)^{n-k}),k=0,1,...,n P{X=k}=Cnkpk(1−p)n−k),k=0,1,...,n]
- “ ∞ \infty ∞”:几何分布: X ∼ G ( p ) X\sim G(p) X∼G(p),[ P { X = k } = q k − 1 p , k = 1 , . . . , n , q = 1 − p P\{X=k\}=q^{k-1}p,k=1,...,n,q=1-p P{X=k}=qk−1p,k=1,...,n,q=1−p],“首中即停”
泊松分布
X ∼ P ( λ ) X\sim P(\lambda) X∼P(λ),[ P { X = k } = λ k k ! e − λ P\{X=k\}=\frac{\lambda^k}{k!}e^{-\lambda} P{X=k}=k!λke−λ],其中 λ \lambda λ表示强度,为X的数学期望; k k k是一个非负整数。
泊松分布可用于研究稀有事件发生的概率或者某时间段某场合源源不断的质点来流的个数。
超几何分布
X ∼ H ( n , N , M ) X\sim H(n,N,M) X∼H(n,N,M),[ P { X = k } = ( C M k C N − M n − k ) / C N n P\{X=k\}=(C_M^kC_{N-M}^{n-k})/C_N^n P{X=k}=(CMkCN−Mn−k)/CNn],表示的是N件产品中有M件正品,从中任取n件,取出k件正品的概率。
3.2. 连续型
均匀分布 X ∼ U ( a , b ) X\sim U(a,b) X∼U(a,b)
X的的概率密度函数和分布函数分别为“ f ( x ) = 1 b − a , a < x < b ; 其 他 情 况 为 0 f(x)=\frac1{b-a},a< x< b;其他情况为0 f(x)=b−a1,a<x<b;其他情况为0”和“ F ( x ) = x − a b − a , a ≤ x ≤ b ; x < a , 0 ; x > b , 1 F(x)=\frac{x-a}{b-a},a\leq x\leq b;x< a,0;x>b,1 F(x)=b−ax−a,a≤x≤b;x<a,0;x>b,1”
指数分布 X ∼ E ( λ ) , λ > 0 X\sim E(\lambda),\lambda>0 X∼E(λ),λ>0
X的概率密度和分布函数分别为“ f ( x ) = λ e − λ x , x > 0 f(x)=\lambda e^{-\lambda x},x>0 f(x)=λe−λx,x>0;其余情况为0”和“ F ( x ) = 1 − e − λ x , x ≥ 0 ; 其 余 情 况 为 0 F(x)=1-e^{-\lambda x},x\geq 0;其余情况为0 F(x)=1−e−λx,x≥0;其余情况为0”。
正态分布 X ∼ N ( u , σ 2 ) X\sim N(u,\sigma^2) X∼N(u,σ2)
概率密度“ f ( x ) = 1 2 π σ e − ( x − u ) 2 2 σ 2 f(x)=\frac1{\sqrt{2\pi}\sigma}e^{-\frac{(x-u)^2}{2\sigma^2}} f(x)=2πσ1e−2σ2(x−u)2”。当 u = 0 , σ = 1 u=0,\sigma=1 u=0,σ=1时称正态分布为标准正态分布,概率密度函数 ϕ ( x ) = 1 2 π e − 1 2 x 2 \phi(x)=\frac1{\sqrt{2\pi}}e^{-\frac12x^2} ϕ(x)=2π1e−21x2,分布函数记为“ Φ ( x ) \Phi(x) Φ(x)”且 Φ ( 0 ) = 1 2 , Φ ( − x ) = 1 − Φ ( x ) \Phi(0)=\frac12,\Phi(-x)=1-\Phi(x) Φ(0)=21,Φ(−x)=1−Φ(x)。此时若 P { X ≥ u a } = a P\{X\geq u_a\}=a P{X≥ua}=a,则称 a a a为标准正态分布的上侧 a a a分位数。
若是一般意义下的正态分布,则分布函数 F ( x ) = P { X ≤ x } = Φ ( x − u σ ) F(x)=P\{X\leq x\}=\Phi(\frac{x-u}{\sigma}) F(x)=P{X≤x}=Φ(σx−u),且有:
- F ( u − x ) + F ( u + x ) = 1 F(u-x)+F(u+x)=1 F(u−x)+F(u+x)=1
- P { a < x < b } = Φ ( b − u σ ) − Φ ( a − u σ ) P\{a< x< b\}=\Phi(\frac{b-u}{\sigma})-\Phi(\frac{a-u}{\sigma}) P{a<x<b}=Φ(σb−u)−Φ(σa−u)
- a x + b ∼ N ( a u + b , a 2 σ 2 ) , a ≠ 0 ax+b\sim N(au+b,a^2\sigma^2),a\neq 0 ax+b∼N(au+b,a2σ2),a=0
4. 一维随机变量函数的分布
此种类型的题目多给定随机变量 X X X的概率密度,然后求新的随机变量比如说 Y = X 2 + 1 Y=X^2+1 Y=X2+1的分布函数,解题思路即: F Y ( y ) = P { Y ≤ y } = P { X 2 + 1 ≤ y } F_Y(y)=P\{Y\leq y\}=P\{X^2+1\leq y\} FY(y)=P{Y≤y}=P{X2+1≤y},之后可以分情况讨论y的取值映射到X的概率密度函数中,并且积分求分布函数。最后若还要求 Y Y Y的概率密度,可以令分布函数对 t t t求导。
欢迎扫描二维码关注微信公众号 深度学习与数学 [每天获取免费的大数据、AI等相关的学习资源、经典和最新的深度学习相关的论文研读,算法和其他互联网技能的学习,概率论、线性代数等高等数学知识的回顾]