随机变量及其分布
一、随机变量
设随机试验的样本空间为S={e}。X=X(e)是定义在样本空间S上的实值单值函数。称X=X(e)为随机变量。(将样本点映射为实值)
二、离散型随机变量
随机变量全部可能取到的值是有限个或可列无限多个,这种随机变量称为离散型随机变量。
1、分布律
设离散型随机变量X所有可能取的值为xk(k=1,2,…),X取各个可能值的概率,即事件{X=xk}的概率,为P{X=xk}=pk, k=1,2,… (公式表示;还可列表表示分布律)
2、三种重要的离散型随机变量
a、(0-1)分布
设随机变量X只可能取0与1两个值,它的分布律是P{X=k}=pk(1-p)1-k, k=0,1 (0<p<1),则称X服从以p为参数的(0-1)分布或两点分布。
b、伯努利试验、二项分布
伯努利试验:设试验E只有两个可能结果:A及
A
‾
\overline{\text{A}}
A,则称E为伯努利试验。将E独立(各次试验的结果互不影响)重复地(每次试验中P(A)=p保持不变)进行n次,则称这一串重复的独立试验为n重伯努利试验。
二项分布:以X表示n重伯努利试验中事件A发生的次数,它的分布律是P{X=k}= ( n k ) \binom n k (kn)pk(1-p)n-k, k=0,1,2,…,n。我们称随机变量X服从参数为n,p的二项分布,并记为X~b(n,p)。当n=1时,二项分布化为(0-1)分布。
c、泊松分布
设随机变量X所有可能取的值为0,1,2,…,而取各个值的概率为P{X=k}=
λ
k
e
−
λ
k
!
\frac{\lambda^ke^{-\lambda}}{k!}
k!λke−λ, k=0,1,2,…,其中
λ
\lambda
λ>0是常数。则称X服从参数为
λ
\lambda
λ的泊松分布,记为X~
π
\pi
π(
λ
\lambda
λ)。
∑
k
=
0
∞
\sum\limits_{k=0}^\infty
k=0∑∞P{X=k}=
∑
k
=
0
∞
\sum\limits_{k=0}^\infty
k=0∑∞
λ
k
e
−
λ
k
!
\frac{\lambda^ke^{-\lambda}}{k!}
k!λke−λ=
e
−
λ
∑
k
=
0
∞
λ
k
k
!
e^{-\lambda}\sum\limits_{k=0}^\infty\frac{\lambda^k}{k!}
e−λk=0∑∞k!λk=
e
−
λ
e
λ
e^{-\lambda}e^{\lambda}
e−λeλ=1.
(其中
e
λ
e^{\lambda}
eλ的泰勒展开为
∑
k
=
0
∞
λ
k
k
!
\sum\limits_{k=0}^\infty\frac{\lambda^k}{k!}
k=0∑∞k!λk)
泊松定理: 设
λ
\lambda
λ>0是一个常数,n是任意正整数,设npn=
λ
\lambda
λ,则对于任一固定的非负整数k,有
lim
n
→
∞
(
n
k
)
p
n
k
(
1
−
p
n
)
k
{\lim\limits_{n \to \infty}}\binom n k p^{k}_{n}(1-p_{n})^{k}
n→∞lim(kn)pnk(1−pn)k=
λ
k
e
−
λ
k
!
\frac{\lambda^ke^{-\lambda}}{k!}
k!λke−λ.
定理的条件npn=
λ
\lambda
λ (常数)意味着当n很大时p必定很小。所以当n很大p很小时有
(
n
k
)
p
n
k
(
1
−
p
n
)
k
≈
λ
k
e
−
λ
k
!
\binom n k p^{k}_{n}(1-p_{n})^{k}\approx\frac{\lambda^ke^{-\lambda}}{k!}
(kn)pnk(1−pn)k≈k!λke−λ(其中
λ
\lambda
λ=np)
三、随机变量的分布函数
定义: 设X是一个随机变量,x是任意实数,函数F(x)=P{X
⩽
\leqslant
⩽x},
−
∞
-\infty
−∞<x<
∞
\infty
∞ 称为X的分布函数。
对于任意实数x1,x2(x1<x2),有P{x1
<
\lt
<X
⩽
\leqslant
⩽x2}=P{X
⩽
\leqslant
⩽x2}-P{x1
<
\lt
<X}=F(x2)-F(x1)
性质:
1.F(x)是一个不减函数
2.0
⩽
\leqslant
⩽F(x)
⩽
\leqslant
⩽ 1,且F(-
∞
\infty
∞)=
lim
n
→
−
∞
{\lim\limits_{n \to -\infty}}
n→−∞limF(x)=0, F(
∞
\infty
∞)=
lim
n
→
∞
{\lim\limits_{n \to \infty}}
n→∞limF(x)=1
3. F(x+0)=F(x), 即F(x)是右连续的。
四、连续型随机变量及其概率密度
定义: 如果对于随机变量X的分布函数F(x),存在非负可积函数
f
(
x
)
f(x)
f(x),使对于任意实数x有F(x)=
∫
−
∞
x
f
(
t
)
d
t
.
\int_{-\infty}^x f(t)dt.
∫−∞xf(t)dt.,则称X为连续型随机变量,
f
(
x
)
f(x)
f(x)称为X的概率密度函数,简称概率密度。
性质:
1.
f
(
x
)
⩾
f(x)\geqslant
f(x)⩾ 0
2.
∫
−
∞
∞
f
(
x
)
d
x
=
1
\int_{-\infty}^{\infty} f(x)dx=1
∫−∞∞f(x)dx=1
3. 对于任意实数x1,x2(x1
⩽
\leqslant
⩽x2),有P{x1
<
\lt
<X
⩽
\leqslant
⩽x2}=F(x2)-F(x1)=
∫
x
1
x
2
f
(
x
)
d
x
\int_{x_1}^{x_2} f(x)dx
∫x1x2f(x)dx
4. 若
f
(
x
)
f(x)
f(x)在点x处连续,则有
F
′
(
x
)
=
f
(
x
)
F^{'}(x)=f(x)
F′(x)=f(x)
三种重要的连续型随机变量
1.均匀分布
若连续型随机变量X具有概率密度
f
(
x
)
=
{
1
b
−
a
,
a
<
x
<
b
0
,
其他
f(x)=\begin{cases} \dfrac{1}{b-a}, a<x<b\\\\ 0, \space\space\space\space\space\space\space\text{其他} \end{cases}
f(x)=⎩⎪⎪⎨⎪⎪⎧b−a1,a<x<b0, 其他
则称X在区间(a,b)上服从均匀分布。记为X~U(a,b)
2.指数分布
若连续型随机变量X的概率密度为
f
(
x
)
=
{
1
θ
e
−
x
/
θ
,
x
>
0
0
,
其他
f(x)=\begin{cases} \dfrac{1}{\theta}\ e^{-x/\theta}, \ x>0\\\\ 0, \space\space\space\space\space\space\space\text{其他} \end{cases}
f(x)=⎩⎪⎪⎨⎪⎪⎧θ1 e−x/θ, x>00, 其他
其中
θ
>
0
\theta>0
θ>0为常数,则称X服从参数为
θ
\theta
θ的指数分布。
性质: 对于任意是s,t>0,有P{X>s+t|X>s}=P{X>t}。
这一性质称为无记忆性。如果X是某一元件的寿命,已知元件已使用了s小时,它总共能使用至少s+t小时的条件概率,与从开始使用时算起它至少能使用t小时的概率相等。这就是说,元件对它已使用过s小时没有记忆。
3.正态分布
若连续型随机变量X的概率密度为
f
(
x
)
=
1
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
2
f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\ e^{-\frac{(x-\mu)^2}{2\sigma^2}}
f(x)=2πσ1 e−2σ2(x−μ)2,
−
∞
<
x
<
∞
-\infty<x<\infty
−∞<x<∞,
其中
μ
\mu
μ,
σ
\sigma
σ(
σ
\sigma
σ>0)为常数,则称X服从参数为
μ
\mu
μ,
σ
\sigma
σ的正态分布或高斯分布,记为X~N(
μ
\mu
μ,
σ
2
\sigma^2
σ2)。
性质:
1.曲线关于x=
μ
\mu
μ对称。这表明对于任意h>0有P{
μ
\mu
μ-h
<
<
<X
⩽
μ
\leqslant\mu
⩽μ}=P{
μ
\mu
μ
<
<
<X
⩽
μ
\leqslant\mu
⩽μ+h}
2.当x=
μ
\mu
μ时取到最大值
f
(
μ
)
=
1
2
π
σ
f(\mu)=\dfrac{1}{\sqrt{2\pi}\sigma}
f(μ)=2πσ1
3.在x=
μ
±
σ
\mu\pm\sigma
μ±σ处有曲线拐点。
特别:
当
μ
\mu
μ=0,
σ
\sigma
σ=1时称随机变量X服从标准正态分布。其概率密度和分布函数分别用
φ
(
x
)
\varphi(x)
φ(x),
Φ
(
x
)
\Phi(x)
Φ(x)表示,即有
φ
(
x
)
=
1
2
π
σ
e
−
x
2
/
2
\varphi(x)=\dfrac{1}{\sqrt{2\pi}\sigma}\ e^{-x^2/2}
φ(x)=2πσ1 e−x2/2
Φ
(
x
)
=
1
2
π
∫
−
∞
x
e
−
t
2
/
2
d
t
\Phi(x)=\dfrac{1}{\sqrt{2\pi}}\int_{-\infty}^{x} e^{-t^2/2}dt
Φ(x)=2π1∫−∞xe−t2/2dt
易知
Φ
(
−
x
)
=
1
−
Φ
(
x
)
\Phi(-x)=1-\Phi(x)
Φ(−x)=1−Φ(x)
若X~N(
μ
\mu
μ,
σ
2
\sigma^2
σ2),则Z=
X
−
μ
σ
\dfrac{X-\mu}{\sigma}
σX−μ~N(0,1)
一个重要的积分: ∫ e − λ x 2 d x = π / λ \int e^{-\lambda x^2}dx=\sqrt{\pi/\lambda} ∫e−λx2dx=π/λ
五、随机变量的函数的分布
例 设随机变量X具有概率密度
f
(
x
)
f(x)
f(x),
−
∞
<
x
<
∞
-\infty<x<\infty
−∞<x<∞,求Y=X2的概率密度。
分别记X,Y的分布函数为FX(x), FY(y)。由于Y=X2
⩾
\geqslant
⩾ 0,故当y
⩽
\leqslant
⩽ 0时,FY(y)=0. 当有y>0时有FY(y)=P{Y
⩽
\leqslant
⩽y}=P{X2
⩽
\leqslant
⩽y}=P{
−
y
⩽
-\sqrt{y}\leqslant
−y⩽X
⩽
y
\leqslant\sqrt{y}
⩽y}=FX(
y
\sqrt{y}
y)
−
-
−FX(
−
y
-\sqrt{y}
−y).
将FY(y)关于y求导数,即得Y的概率密度为
f
Y
(
y
)
=
{
1
2
y
[
f
x
(
y
)
+
f
x
(
−
y
)
]
,
y
>
0
0
,
y
⩽
0
f_Y(y)=\begin{cases} \dfrac{1}{2\sqrt{y}}[f_x(\sqrt{y})+f_x(-\sqrt{y})], \ y>0\\ 0, \space\space\space\space\space\space\space y\leqslant0 \end{cases}
fY(y)=⎩⎨⎧2y1[fx(y)+fx(−y)], y>00, y⩽0