随机变量
定义
设随机试验E的样本空间为S={e},若X=X(e)是定义在样本空间S的上的一个单值实函数,则称X=X(e)为随机变量
简单说,让每一个样本点e对应着唯一的实数X(e),便得到随机变量X=X(e)
离散型随机变量
若随机变量只可能取有限个或可数无限个值时
连续型随机变量
若随机变量只可能取一个区间中的所有实数时
随机变量的概率
随机变量X取某个值x的事件用记号{X=x}表示,其概率记为{X=x}
若L是一个实数集,将随机变量X在L中取值的事件记作{X∈L},其概率记为P{X
∈
∈
L}
P{X∈L}=P{e|X(e)∈L}
离散型随机变量及其分布律
设离散型随机变量X所有可能的取值为xk,X取xk的概率为P{X=xk}=pk (k=1,2,…)
性质
1.非负性 Pk≥0,k=1,2,…
2.规范性 p1+p2+…+pn =1
分布律
x | x1 x2 … xk |
---|---|
pk | p1 p2 … pk |
∑k=1∞Pk=1 ∑ k = 1 ∞ P k = 1
X的每一个取值各占一些概率,这些概率加起来为1,即概率1以一定的规律分布着各个可能的值上。
0-1分布
定义
只取0和1两个值的随机变量所服从的分布称为0-1分布
设P{X=1}= p (0 < p <1) ,则P{X=0}=1-p
PX=k=pk(1−p)1−k(k=0,1)
P
X
=
k
=
p
k
(
1
−
p
)
1
−
k
(
k
=
0
,
1
)
x | 0 1 |
---|---|
p_k | 1-p p |
二项分布
设X表示n重伯努利试验中事件A发生的次数,则X是一个随机变量,X可能的取值为0,1,…,n。
用Ai表示事件A在第i次试验中发生(i=0,1,…,n)
假设A发生在第n1,..,nk次的试验,
这k次试验A发生概率为P(
A1⎯⎯⎯⎯⎯⎯⎯
A
1
¯
…
An−1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯
A
n
−
1
¯
An
An+1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯
A
n
+
1
¯
…
Ak−1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯
A
k
−
1
¯
Ak
Ak+1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯
A
k
+
1
¯
)=(1-p)…(1-p)p(1-p)…(1-p)p(1-p)…(1-p)=pk(1-p)n-k
由于A发生在哪k次试验有
Ckn
C
n
k
种
公式
P{X=k}=
Ckn
C
n
k
pk(1-p)n-k
随机变量X服从参数n,p的二项分布,记为X~b(n,p)
规范性
∑k=0nCkn
∑
k
=
0
n
C
n
k
pk(1-p)n-k=[p+(1-p)]n=1
二项分布为0-1分布b(1,p)
P{X=k}=pk(1-p)n-k (k=0,1) (C_0^1
=
=
C_1^1$=1)
例子
某人进行射击,每次射中命中率0。02,独立射击400次,至少中两次概率
P~b(400,0.02)
P{X=k}=0.02k(1-0.02)400-k
P{X≥2}=1-P{X=0}-P{X=1}
=1-
C4000
C
4
00
0
0.020(1-0.02)400-0-
C4000
C
4
00
0
0.021(1-0.02)400-1=0.9972
泊松分布
知道发生的的平均次数
λ
λ
P=λn
P
=
λ
n
X~b(n,
λn
λ
n
)推出
定义
设随机变量X所以可能的取值为一起自然数0,1,2…,且取值k(k=0,1,2,..)的概率为
Pk
P
k
= P{X=k} =
λkk!e−λ
λ
k
k
!
e
−
λ
其中
λ
λ
>0的常数,则称X服从参数为
λ
λ
的泊松分布。X~π(\lambda)
可以通过泊松分布表计算
规范性
例子
保险公司承保5000张同年龄为期一年的保单。如果合同期死亡,则赔付3万元。设1年内死亡概率为0.0015,且投保人是互为独立时间。求保险公司对于这批保险人赔付不超过30w的概率
X~b(5000,0.0015)
总赔付额为3X万元
求概率P{3X≤30}=P{X≤10}
二项分布
P{X≤10}=
∑k=010Ck5000
∑
k
=
0
10
C
5000
k
0.0015k(1-0.0015)5000-k
计算困难,用泊松分布
\lambda=np=5000×0.0015=7.5
P{X≤10}=
∑k=0107.5kk!e−7.5
∑
k
=
0
10
7.5
k
k
!
e
−
7.5
直接查表
几何分布 试验直到成功的概率
用Ai表示事件A在第i次试验中发生(i=0,1,…,n)假设第kci试验中A第一次发生,则
P{X=k}=P(
A1⎯⎯⎯⎯⎯⎯⎯
A
1
¯
…
Ak−1⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯
A
k
−
1
¯
Ak)=(1-p)…(1-p)p=(1-p)k-1p
定义
设多重伯努利试验中,事件A发生的概率为p(0 < p < 1),记X为A第一次发生时的试验次数,则X取值k的概率
P{X=k}=(1-p)k-1p (k=1,2…)
称X服从参数为p的几何分布,记作X~G(p)
x | 1 2 … k … |
---|---|
pk | p (1-p)p … (1-p)k-1p … |
规范性
∑k=1∞(1−p)k−1p=p∑k=1∞(1−p)k−1=p11−(1−p)=p1p=1
∑
k
=
1
∞
(
1
−
p
)
k
−
1
p
=
p
∑
k
=
1
∞
(
1
−
p
)
k
−
1
=
p
1
1
−
(
1
−
p
)
=
p
1
p
=
1
几何级数(等比级数)
等比级数的和=
首项1−公比
首
项
1
−
公
比
超几何分布
设有N件产品,其中有D件次品。今从中任取n件,问其中恰有k件次品(k≤D)的概率是多少?
在N件产品中取n件(不放回)的取法有
CnN
C
N
n
种
在D件次品中取k件的取法有
CkD
C
D
k
种
在N-D件正品中取n-k件的取法有
CN−Dn−k
C
N
−
D
n
−
k
种
在N件产品中取n件,其中恰有k件次品的取法有
CkD
C
D
k
CN−Dn−k
C
N
−
D
n
−
k
种
P(A)=CkDCN−Dn−kCnN
P
(
A
)
=
C
D
k
C
N
−
D
n
−
k
C
N
n
定义
设有N件产品,其中有M件次品。从中任取n件,则其中恰有k件次品(k≤M)的概率是
设随机变量X表示取出n件产品中的次品数,
则P{X=k}={
CkM
C
M
k
CN−Mn−k
C
N
−
M
n
−
k
}\over {
CnN
C
N
n
} k=0,1,…,n
称X服从参数为n,M,N的超几何分布
与二项分布关系
当N很大时候,超几何分布和二项分布近似
随机变量的分布函数 累积分布函数
分布函数概率
定义
设X是一个随机变量(离散型或连续型),x是任意实数,称事件{X≤x}的概率P{X≤x}为X的分布函数,记作
F(x)=P{X≤x} 定义域整个实数域
对于任何实数x1,x2 (x1 < x2) , 都有P{x1 < X ≤ x2}=P{X ≤ x2}-P{X ≤ x1}=F(x2)-F(x1)
性质1
分布函数F(x)是实数域上( −∞,+∞ − ∞ , + ∞ )的单调不减函数
性质2
0≤F(x)≤1
F(
−∞
−
∞
)=0 F(
+∞
+
∞
)=1
性质3
分布函数F(x)至多有可数个跳跃间断点,且处处都是右连续的,即对任何实数x0,都有
F(X0+0)=limx→x0F(x)=F(x0)
F
(
X
0
+
0
)
=
lim
x
→
x
0
F
(
x
)
=
F
(
x
0
)
公式
P{X≤a}=F(a)
P{X<a}=F(a-0)
P{X=a}=F(a)-F(a-0)
P{X>a}=1-F(a)
P{X≥a}=1-F(a-0)
P{a≤X<b}=F(b-0)-F(a-0)
P{a<X<b}=F(b-0)-F(a)
P{a≤X≤b}=F(b)-F(a-0)
离散型随机变量的分布函数
函数概率的累积
连续型随机变量及其密度函数
连续型随机变量及其密度函数的概念
定义
如果随机变量X的分布函数F(x)可以写成以下形式:
其中f(x)是定义在 (−∞,+∞) ( − ∞ , + ∞ ) 上的非负可积函数,则称X为连续型随机变量,
f(x)称为X的概率密度函数。
性质1
f(x)≥0 非负性
性质2
F(x)=∫+∞−∞f(x)dx=1 F ( x ) = ∫ − ∞ + ∞ f ( x ) d x = 1 规范性
性质3
若f(x)在x处联系,则F(x)在x处可导,且
F’(x)=f(x)
性质4
对任意实数x1,x2(x1
均匀分布
定义
若连续随机变量X具有概率密度
则称X在区间[a,b]上服从均匀分布,记为X~U(a,b
)
意义
若X~U(a,b),则X落在区间(a,b)中任意长度的子区间的可能性是相同的。
随机变量X落入每一个小区间概率都是
1b−a
1
b
−
a
=
(b−a)nb−a
(
b
−
a
)
n
b
−
a
=
1n
1
n
即落入每一个小区间都是等可能的,所以概率被均匀的分布在区间[a,b]上。
分布函数
指数分布
定义
若连续型随机变量X具有概率密度
则称X服从参数为 λ λ 的指数分布,记为X~E( λ λ )
分布函数
性质 无记忆性
∀s,t
∀
s
,
t
>0,有P{X > s+t | X>s}=P{X>t}
在一只X>s发生的条件下,则X>s+t发生的概率就等于{X>t}发生的概率
如,X是一个电子元件的寿命,若已知元件已经使用了s小时(X>s发生),它能再使用t小时(一共使用s+t小时,X>s+t发生)的概率,与它从开始使用起能用t小时的概率相等。
指数分布通常来作为各种寿命的分布
正态分布 高斯分布
若连续型随机变量X具有概率密度
f(x)=
12π√σ
1
2
π
σ
e−(x−μ)22σ2
e
−
(
x
−
μ
)
2
2
σ
2
(−∞<x<+∞)
(
−
∞
<
x
<
+
∞
)
其中
μ,σ(σ>0)
μ
,
σ
(
σ
>
0
)
是常数,则称X服从参数为
μ,σ
μ
,
σ
的正态分布,记作X~N(
μ,σ2
μ
,
σ
2
)
μ
μ
为X的均值
σ
σ
为方差
图像性质
1.y=f(x)的图形关于直线x=
μ
μ
对称。
即f(
mu
m
u
-h)=f(
mu
m
u
+h)
2.y=f(x)在x=
μ
μ
处的最大值f(
μ
μ
)=
12π√σ
1
2
π
σ
3.x离
μ
μ
越远,f(x)的值越小
4.y=f(x)在x=
μ+σ
μ
+
σ
有两个拐点
5.y=f(x)以x轴为其水平渐近线
6.当
σ
σ
固定时,
μ
μ
决定y=f(x)的左右位置,
μ
μ
称为正态分布的位置参数。
7.当
μ
μ
固定是,
σ
σ
决定y=f(x)的集中程度。
σ
σ
越小,y=f(x)的图形越尖,越高,X落在
μ
μ
附件概率越大
分布函数
F(x)=
12π√σ
1
2
π
σ
∫∞xe−(x−μ)22σ2
∫
x
∞
e
−
(
x
−
μ
)
2
2
σ
2
原函数不是初等函数,只能写成积分上限函数
标准正态分布
当
mu
m
u
=0,
σ
σ
=1时的正态分布称为标准正态分布,记作X~N(0,1)
φ(x)
φ
(
x
)
=
12π√
1
2
π
ex22
e
x
2
2
标准化
若X~N(
μ,σ2
μ
,
σ
2
)则Z={X-
mu
m
u
\over
σ
σ
}~N{0,1}
F(x)=
ϕ
ϕ
(
x−μσ
x
−
μ
σ
)
公式
P{X ≤ x}=
ϕ
ϕ
(
x−μσ
x
−
μ
σ
)
P{|X| ≤ x}=
2ϕ
2
ϕ
(
x−μσ
x
−
μ
σ
)-1
P{x1 < X ≤ x2}=
ϕ
ϕ
(
x2−μσ
x
2
−
μ
σ
)-
ϕ
ϕ
(
x1−μσ
x
1
−
μ
σ
)
随机变量的函数的分布
定义
设g(x)是定义在随机变量X的一切可能取值x的集合上的函数。
如果对于X的每一个可能的取值x,另一个变量Y取值相应的值y=g(x),则称Y为X的函数。记作Y=g(x)