一维随机变量及其分布

随机变量及其分布

随机变量及其分布

离散化

将任意样本空间 Ω \Omega Ω的元素离散化,用实数 x 1 , x 2 . . . , x n x_1,x_2...,x_n x1,x2...,xn代表这个n元素 ω 1 , ω , . . . , ω n \omega_1,\omega_,...,\omega_n ω1,ω...,ωn,其中 x i = X ( ω i ) x_i=X(\omega_i) xi=X(ωi) X X X为样本空间到实数域的单质实值函数
X : Ω → N X:\Omega\rightarrow \N X:ΩN
X = X ( ω ) X=X(\omega) X=X(ω)即为随机变量

为什么引入随机变量这个概念?
我的理解:
设人群为 Ω \Omega Ω,任意 ω 0 ∈ Ω \omega_0\in\Omega ω0Ω表示人群中的任意一个人 ω 0 \omega_0 ω0,人群可能有很多属性值得研究,比如收入问题,年龄问题,但是现在只对人群的身高问题感兴趣,那么对每个人,多富多胖我都不关心,我只看他的身高,记 X = X ( ω ) X=X(\omega) X=X(ω)为对 ω \omega ω这个人取身高的函数. X 1 = X ( ω 1 ) X_1=X(\omega_1) X1=X(ω1)即表示第一个人的身高,以后的研究就 { X n } \{X_n\} {Xn}这个集合上展开了

本章就建立在此之上

随机变量分布函数

定义 F ( x ) = P ( X ≤ x ) , x ∈ R F(x)=P(X≤x),x\in \R F(x)=P(Xx),xR

一群人中随机挑选一个,求其身高在 180 c m 180cm 180cm以下的概率:
设人群为 Ω \Omega Ω,任意 ω ∈ Ω \omega\in\Omega ωΩ表示人群中的任意一个人 ω \omega ω,记 X = X ( ω ) X=X(\omega) X=X(ω)为对 ω \omega ω这个人取身高的函数
设样本空间为 Ω = { ω 1 , ω 2 , . . . , ω n } \Omega=\{\omega_1,\omega_2,...,\omega_n\} Ω={ω1,ω2,...,ωn}通过取身高函数 X X X映射为 { X 1 , X 2 , . . . , X n } \{X_1,X_2,...,X_n\} {X1,X2,...,Xn},问题转化为 { X 1 , X 2 , . . . , X n } \{X_1,X_2,...,X_n\} {X1,X2,...,Xn}集合中小于180的个数占总个数n的比例

性质:
P ( x 1 < X ≤ x 2 ) = F ( x 2 ) − F ( x 1 ) P(x_1<X≤x_2)=F(x_2)-F(x_1) P(x1<Xx2)=F(x2)F(x1)
0 ≤ F ( x ) ≤ 1 , F ( − ∞ ) = 0 , F ( + ∞ ) = 1 0≤F(x)≤1,F(-\infin)=0,F(+\infin)=1 0F(x)1,F()=0,F(+)=1
F ( x ) F(x) F(x)单调不减
F ( x ) F(x) F(x)右连续

离散型随机变量及其分布律

离散型随机变量:有限或者可列无限

随机变量 X X X有有限多个或者可列无限多个时称为离散型随机变量

可列就是这个集合可以找到与自然数集N的双射函数。//可列
自然数集有无穷个元素,所以如果一个集合可以与N一一对应,自然也有无穷个元素。//无穷

研究离散型随机变量 X X X的统计规律就是要掌握 X X X所有可能的取值以及对应的概率

分布律 P ( X = x i ) = p i P(X=x_i)=p_i P(X=xi)=pi

分布律的两种表示:
1.表达式形式 P ( X = x i ) = p i , i = 1 , 2 , . . . P(X=x_i)=p_i,i=1,2,... P(X=xi)=pi,i=1,2,...
2.表格形式

X X X x 1 x_1 x1 x 2 x_2 x2
P P P p 1 p_1 p1 p 2 p_2 p2
性质:
∀ p i ≥ 0 , i = 1 , 2 , . . . \forall p_i≥0,i=1,2,... pi0,i=1,2,...
∑ i p i = 1 \sum_i p_i=1 ipi=1

分布函数 F ( x ) = ∑ x i ≤ x P ( X = x i ) F(x)=\sum_{x_i≤x}P(X=x_i) F(x)=xixP(X=xi)

F ( x ) = P ( X ≤ x ) = ∑ x i ≤ x P ( X = x i ) F(x)=P(X≤x)=\sum_{x_i≤x}P(X=x_i) F(x)=P(Xx)=xixP(X=xi)

分布模型

1.两点分布 P ( X = k ) = p k ( 1 − p ) 1 − k , k = 0 , 1 P(X=k)=p^k(1-p)^{1-k},k=0,1 P(X=k)=pk(1p)1k,k=0,1

X ∼ B ( 1 , p ) : X\sim B(1,p): XB(1,p):离散型随机变量X服从参数为p的两点分布

X X X取值要么0要么1只有这两种情况,取值为1的概率为p,由 ∑ p i = 1 \sum p_i=1 pi=1知取值为0的概率为1-p

2.二项分布 P ( X = k ) = C n k p k q n − k , q + p = 1 , k = 0 , 1 , 2 , . . . P(X=k)=C_n^kp^kq^{n-k},q+p=1,k=0,1,2,... P(X=k)=Cnkpkqnk,q+p=1,k=0,1,2,...

X ∼ B ( n , p ) : X\sim B(n,p): XB(n,p):离散型随机变量X服从参数为n,p的二项分布

当n=1时退化为两点分布 X ∼ B ( 1 , p ) X\sim B(1,p) XB(1,p)

参数意义:
n : n: n:n次独立重复试验
p : p: p:每次的成功概率都是p
分布律意义:n次试验中有k次试验是成功的概率

3.泊松分布
泊松定理 lim ⁡ n → ∞ C n k p k ( 1 − p ) n − k = λ k k ! e − λ \lim_{n\rightarrow \infin}C^k_np^k(1-p)^{n-k}=\frac{\lambda^k}{k!}e^{-\lambda} limnCnkpk(1p)nk=k!λkeλ

泊松定理在n很大时具有很好的拟合效果
λ > 0 \lambda>0 λ>0是一常数, n n n为任意正整数,满足 n p = λ np=\lambda np=λ,对任意非负常数 k k k,有:
lim ⁡ n → ∞ C n k p k ( 1 − p ) n − k = λ k k ! e − λ \lim_{n\rightarrow \infin}C^k_np^k(1-p)^{n-k}=\frac{\lambda^k}{k!}e^{-\lambda} nlimCnkpk(1p)nk=k!λkeλ

左 侧 = lim ⁡ n → ∞ n ( n − 1 ) ( n − 2 ) . . . ( n − k + 1 ) k ! ( λ n ) k ( 1 − λ n ) n ( 1 − λ n ) − k = lim ⁡ n → ∞ n k 1 ( 1 − 1 n ) ( 1 − 2 n ) . . . ( 1 − k − 1 n ) k ! ( λ n ) k ( 1 − λ n ) − n λ × ( − λ ) ( 1 − λ n ) − k = lim ⁡ n → ∞ λ k k ! e − λ = 右 侧 \begin{aligned} 左侧&= \lim_{n\rightarrow \infin}\frac{n(n-1)(n-2)...(n-k+1)}{k!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^n(1-\frac{\lambda}{n})^{-k}\\ &=\lim_{n\rightarrow \infin}\frac{n^k1(1-\frac{1}{n})(1-\frac{2}{n})...(1-\frac{k-1}{n})}{k!}(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{-\frac{n}{\lambda}\times{(-\lambda)}}(1-\frac{\lambda}{n})^{-k}\\ &=\lim_{n\rightarrow \infin}\frac{\lambda^k}{k!}e^{-\lambda}\\ &=右侧 \end{aligned} =nlimk!n(n1)(n2)...(nk+1)(nλ)k(1nλ)n(1nλ)k=nlimk!nk1(1n1)(1n2)...(1nk1)(nλ)k(1nλ)λn×(λ)(1nλ)k=nlimk!λkeλ=

泊松分布 P ( X = k ) = λ k k ! e − λ , λ > 0 , k = 0 , 1 , 2 , . . . P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda},\lambda>0,k=0,1,2,... P(X=k)=k!λkeλ,λ>0,k=0,1,2,...

根据泊松定理的形式,泊松分布可以看做二项分布时试验次数无穷大时的情形
X ∼ P ( λ ) : X\sim P(\lambda): XP(λ):离散型随机变量X服从参数为 λ \lambda λ的泊松分布

证明泊松分布满足离散型随机变量分布律的性质:
1.显然 λ k k ! e − λ > 0 \frac{\lambda^k}{k!}e^{-\lambda}>0 k!λkeλ>0
2.
∑ k = 0 ∞ λ k k ! e − λ = e − λ ∑ k = 0 ∞ λ k k ! \sum_{k=0}^\infin \frac{\lambda^k}{k!}e^{-\lambda}=e^{-\lambda}\sum_{k=0}^\infin \frac{\lambda^k}{k!} k=0k!λkeλ=eλk=0k!λk

g k ( x ) = ∑ k = 1 x k k ! , x > 0 , k ∈ N g_k(x)=\sum_{k=1}\frac{x^k}{k!},x>0,k\in N gk(x)=k=1k!xk,x>0,kN
恰好为 e x e^x ex的麦克劳林展开式
g k ( x ) = ∑ k = 1 x k k ! = e x g_k(x)=\sum_{k=1}\frac{x^k}{k!}=e^x gk(x)=k=1k!xk=ex
g k ( λ ) = e λ g_k(\lambda)=e^{\lambda} gk(λ)=eλ
∑ k = 0 ∞ λ k k ! e − λ = e − λ ∑ k = 0 ∞ λ k k ! = e − λ e λ = 1 \sum_{k=0}^\infin \frac{\lambda^k}{k!}e^{-\lambda}=e^{-\lambda}\sum_{k=0}^\infin \frac{\lambda^k}{k!}=e^{-\lambda}e^\lambda=1 k=0k!λkeλ=eλk=0k!λk=eλeλ=1

4.几何分布 P ( X = k ) = ( 1 − p ) k − 1 p      ( k = 1 , 2 , . . . ) P(X=k)=(1-p)^{k-1}p\ \ \ \ (k=1,2,...) P(X=k)=(1p)k1p    (k=1,2,...)

X ∼ G E ( p ) : X\sim GE(p): XGE(p):离散型随机变量X服从参数为p的几何分布

参数意义:
独立重复试验的成功概率为p,恰好在第k次试验成功,前k-1次均失败的概率

5.超几何分布 P ( X = k ) = C M k C N − M n − k C N n , k = 0 , 1 , . . . , m i n ( M , n ) P(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},k=0,1,...,min(M,n) P(X=k)=CNnCMkCNMnk,k=0,1,...,min(M,n)

X ∼ H ( n , M , N ) : X\sim H(n,M,N): XH(n,M,N):离散型随机变量 X X X服从参数为 n , M , N n,M,N n,M,N的超几何分布

参数意义:
一共有N件产品,其中有M件次品,从中任取n件取到次品数为X的概率为:
从 M 个 次 品 中 挑 出 k 个 的 组 合 数 × 从 N − M 个 正 品 中 挑 出 n − k 个 的 组 合 数 从 N 个 物 品 总 任 意 挑 出 n 个 的 组 合 数 \frac{从M个次品中挑出k个的组合数\times 从N-M个正品中挑出n-k个的组合数}{从N个物品总任意挑出n个的组合数} NnMk×NMnk

超几何分布与二项分布的关系:

超几何分布实际上可以看做如下情形:

N个大小形状一模一样的球,其中有M个红球,N-M个黑球,从中任意不放回摸出n个球,求摸到的红球个数为k的概率

二项分布可以看做如下情形:

N个大小形状一模一样的球,其中有M个红球,N-M个黑球,从中任意放回摸出n个球,求摸到的红球个数为k的概率

两者的区别在于放回与否
如果不放回则每次试验相互独立,成功概率相同
如果放回则上一次试验一定会影响下一次试验的概率

因此分布律公式给出的时候二项分布的参数直接写的是固定的概率,
而超几何分布给出的是个数(没有固定概率)

但是当N趋向于无穷大时,也就是摸出来的n个球对于总数N来说稀松时,可以认为两种分布是等价的

在求取出的红球数的数学期望的时候两种分布情况的相同的:
将所有N个球不管颜色都打成粉末,摇匀,
二项分布模型每次取出一勺记下勺子中红黑粉量之后将这勺"球"倒回去
超几何分布模型每次取出一勺记下勺子中红黑粉量之后将这勺"球"吃了
显然已经摇匀的球粉倒不倒回去不会影响下一勺中红黑粉末的比重
那么摸出k个球相当于舀出k勺,其中红球数量的期望就是 k × M N k\times \frac{M}{N} k×NM,黑球数量的期望就是 k × N − M N k\times \frac{N-M}{N} k×NNM

连续型随机变量及其概率密度

连续型随机变量

定义: F ( x ) = ∫ − ∞ x f ( t )   d t F(x)=\int_{-\infin}^xf(t)\,dt F(x)=xf(t)dt

其中 f ( t ) f(t) f(t) ( − ∞ , ∞ ) (-\infin,\infin) (,)上的非负可积函数,称为X的概率密度函数,简称概率密度

概率密度的性质:

f ( x ) f(x) f(x)为连续型随机变量 X X X的概率密度

1.非负
2. ∫ − ∞ + ∞ f ( t )   d t = 1 \int_{-\infin}^{+\infin}f(t)\,dt=1 +f(t)dt=1
3. P ( a < x ≤ b ) = ∫ a b f ( t )   d t P(a<x≤b)=\int_{a}^{b}f(t)\,dt P(a<xb)=abf(t)dt
4. f ( x ) f(x) f(x)的连续点处有 F ′ ( x ) = f ( x ) F'(x)=f(x) F(x)=f(x)
5.有概率密度的离散型随机变量的分布函数一定连续
6.单点处概率为0, P ( x = x 0 ) = ∫ x 0 x 0 f ( t )   d t = 0 P(x=x_0)=\int_{x_0}^{x_0}f(t)\,dt=0 P(x=x0)=x0x0f(t)dt=0

不可能事件概率一定为0,但是概率为0的不一定是不可能事件

分布模型

1.均匀分布 X ∼ U ( a , b ) X\sim U(a,b) XU(a,b)

概 率 密 度 f ( x ) = { 1 b − a , a < x ≤ b 0 , x ≤ a 或 x > b 概率密度f(x)= \begin{cases} \frac{1}{b-a},a<x≤b\\ 0,x≤a或x>b \end{cases} f(x)={ba1,a<xb0,xax>b
分 布 函 数 F ( x ) = ∫ f ( x )   d x = { 0 , x < a x − a b − a , a < x ≤ b 1 , x > b 分布函数F(x)=\int f(x)\,dx=\begin{cases}0,x<a\\ \frac{x-a}{b-a},a<x≤b\\ 1,x>b \end{cases} F(x)=f(x)dx=0,x<abaxa,a<xb1,x>b

2.正态分布 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) XN(μ,σ2)

概 率 密 度 f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < + ∞ 概率密度f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},-\infin<x<+\infin f(x)=2π σ1e2σ2(xμ)2,<x<+
分 布 函 数 F ( x ) = ∫ f ( x )   d x 分布函数F(x)=\int f(x)\,dx F(x)=f(x)dx

标准正态分布 X ∼ N ( 0 , 1 ) X\sim N(0,1) XN(0,1)

概 率 密 度 ϕ ( x ) = 1 2 π e − x 2 2 概率密度\phi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}} ϕ(x)=2π 1e2x2
分 布 函 数 Φ ( x ) = ∫ ϕ ( x )   d x 分布函数\Phi(x)=\int \phi(x)\,dx Φ(x)=ϕ(x)dx

Φ ( − x ) = 1 − Φ ( x ) \Phi(-x)=1-\Phi(x) Φ(x)=1Φ(x)
标准化 Z = X − μ σ Z=\frac{X-\mu}{\sigma} Z=σXμ

正态分布转化为标准正态分布:
X ∼ N ( μ , σ ) X\sim N(\mu,\sigma) XN(μ,σ),
Z = X − μ σ ∼ N ( 0 , 1 ) Z=\frac{X-\mu}{\sigma}\sim N(0,1) Z=σXμN(0,1)称Z为X的标准化

3 σ \sigma σ规则
X范围概率
( μ − σ , μ + σ ) (\mu-\sigma,\mu+\sigma) (μσ,μ+σ)0.6526
( μ − 2 σ , μ + 2 σ ) (\mu-2\sigma,\mu+2\sigma) (μ2σ,μ+2σ)0.9544
( μ − 3 σ , μ + 3 σ ) (\mu-3\sigma,\mu+3\sigma) (μ3σ,μ+3σ)0.9974
3.指数分布 X ∼ E ( λ ) X\sim E(\lambda) XE(λ)

概 率 密 度 f ( x ) = { λ e − λ x , x ≥ 0 0 , x < 0 概率密度f(x)=\begin{cases} \lambda e^{-\lambda x},x≥0\\ 0,x<0 \end{cases} f(x)={λeλx,x00,x<0
分 布 函 数 F ( x ) = ∫ f ( x ) d x = { 1 − e − λ x , x ≥ 0 0 , x < 0 分布函数F(x)=\int f(x)dx=\begin{cases} 1-e^{-\lambda x},x≥0 \\0,x<0 \end{cases} F(x)=f(x)dx={1eλx,x00,x<0

无记忆性 P ( X > ( s + t ) ∣ X > s ) = P ( X > t ) P(X>(s+t)|X>s)=P(X>t) P(X>(s+t)X>s)=P(X>t)
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

灰球球

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值