hello,大家好
这里是第九期概率论与数理统计的学习,我将用这篇博客去总结这期的知识点和用C语言去实现做题的过程。
本期知识点:
随机向量函数的分布
- Z = X + Y Z=X+Y Z=X+Y的分布
- Z = m a x { X , Y } Z=max\{X,Y\} Z=max{X,Y}和 Z = m i n { X , Y } Z=min\{X,Y\} Z=min{X,Y}的分布
ok进入知识总结环节
💦 随机向量函数的分布
在前面我们学到随机变量函数的分布,现在通过区别随机变量的分布函数与随机变量函数的分布来回忆一下。
分布函数的公式: F ( x ) = P { X ≤ x } = ∫ − ∞ x f ( x ) d x F(x)=P\{X\leq x\}=\int_{-\infty}^{x}f(x)dx F(x)=P{X≤x}=∫−∞xf(x)dx
现给出两个随机变量
X
X
X和
Y
Y
Y,已知
X
X
X的概率密度函数,
Y
=
2
X
Y=2X
Y=2X,求
Y
Y
Y的概率密度函数。然后我们通过如下变化即可求得
Y
Y
Y的分布函数:
F
(
y
)
=
P
{
Y
≤
y
}
=
P
{
2
X
≤
x
}
=
P
{
X
≤
x
2
}
=
∫
−
∞
x
2
f
(
x
)
d
x
F(y)=P\{Y\leq y\}=P\{2X\leq x\}=P\{X\leq \frac{x}{2}\}=\int_{-\infty}^\frac{x}{2}f(x)dx
F(y)=P{Y≤y}=P{2X≤x}=P{X≤2x}=∫−∞2xf(x)dx
由此再对它求导即可得 Y Y Y的概率密度函数 f ( y ) f(y) f(y)。
由上我们可以知道,所谓函数的分布,无非就是已知一个随机变量 X X X的某些性质,然后求另一个随机变量 Y Y Y的某些性质,而 Y Y Y又恰恰是关于 X X X的函数(就是 Y Y Y与 X X X有联系)。也就是这么一个叫法,不用太在意,知道怎么求就行了。
那么随机向量函数的分布与随机变量函数的分布差别在哪呢?
随机变量只有一个变量的限制,所以涉及到的积分都是一重的,而随机向量有两个变量的限制,所以涉及的积分通常都是二重的。也就是说随机变量 Z Z Z是关于两个变量 X X X和 Y Y Y的函数。
这里仅对二维连续型随机向量 ( X , Y ) (X,Y) (X,Y)的情形加以讨论,并且只讨论两种特殊的情况(我自己课程的要求)。
这两种特殊的函数关系是:
-
- Z = X + Y Z=X+Y Z=X+Y
-
- Z = m a x { X , Y } Z=max\{X,Y\} Z=max{X,Y}和 Z = m i n { X , Y } Z=min\{X,Y\} Z=min{X,Y}
☁️ Z=X+Y的分布
设二维连续型随机向量 ( X , Y ) (X,Y) (X,Y)的概率密度函数为 f ( x , y ) f(x,y) f(x,y),求 Z = X + Y Z=X+Y Z=X+Y的概率密度函数 f Z ( z ) f_Z(z) fZ(z)。
首先,有
F
Z
(
z
)
=
P
{
Z
≤
z
}
=
P
{
X
+
Y
≤
z
}
F_Z(z)=P\{Z\leq z\}=P\{X+Y\leq z\}
FZ(z)=P{Z≤z}=P{X+Y≤z}
然后根据
X
+
Y
≤
z
X+Y\leq z
X+Y≤z的关系,在坐标系上表示如下:
图中的直线就是 y = − x + z y=-x+z y=−x+z,而 X + Y ≤ z X+Y\leq z X+Y≤z表示的区域就是图中直线下面的全部区域
于是续接上述公式,可得 P { X + Y ≤ z } = ∬ x + y ≤ z f ( x , y ) d x f y = ∫ − ∞ + ∞ d x ∫ − ∞ z − x f ( x , y ) d y = ∫ − ∞ + ∞ [ ∫ − ∞ z − x f ( x , y ) d y ] d x P\{X+Y\leq z\}=\iint_{x+y\leq z}f(x,y)dxfy=\int_{-\infty}^{+\infty}dx\int_{-\infty}^{z-x}f(x,y)dy=\int_{-\infty}^{+\infty}[\int_{-\infty}^{z-x}f(x,y)dy]dx P{X+Y≤z}=∬x+y≤zf(x,y)dxfy=∫−∞+∞dx∫−∞z−xf(x,y)dy=∫−∞+∞[∫−∞z−xf(x,y)dy]dx
然后作一个变量代换,令 u = y + x u=y+x u=y+x,那么 y = u − x y=u-x y=u−x
- 当 y = − ∞ y=-\infty y=−∞时, u = − ∞ u=-\infty u=−∞
- 当 y = z − x y=z-x y=z−x时, u = z u=z u=z
那么又续接上述公式,可得
∫
−
∞
+
∞
[
∫
−
∞
z
−
x
f
(
x
,
y
)
d
y
]
d
x
=
∫
−
∞
+
∞
[
∫
−
∞
z
f
(
x
,
u
−
x
)
d
u
]
d
x
=
∫
−
∞
z
[
∫
−
∞
+
∞
f
(
x
,
u
−
x
)
d
x
]
d
u
\int_{-\infty}^{+\infty}[\int_{-\infty}^{z-x}f(x,y)dy]dx=\int_{-\infty}^{+\infty}[\int_{-\infty}^{z}f(x,u-x)du]dx=\int_{-\infty}^z[\int_{-\infty}^{+\infty}f(x,u-x)dx]du
∫−∞+∞[∫−∞z−xf(x,y)dy]dx=∫−∞+∞[∫−∞zf(x,u−x)du]dx=∫−∞z[∫−∞+∞f(x,u−x)dx]du
最后,可以得到
F
Z
(
z
)
=
∫
−
∞
z
[
∫
−
∞
+
∞
f
(
x
,
u
−
x
)
d
x
]
d
u
F_Z(z)=\int_{-\infty}^{z}[\int_{-\infty}^{+\infty}f(x,u-x)dx]du
FZ(z)=∫−∞z[∫−∞+∞f(x,u−x)dx]du
注意:这里面的 z z z是一个具体的值,而前面作的代换 u = x + y u=x+y u=x+y的 u u u其中就相当于变量 z z z,这里也只是为了区别一个具体的值和变量
将上式与下式对比:
F
Z
(
z
)
=
∫
−
∞
z
f
Z
(
z
)
d
z
F_Z(z)=\int_{-\infty}^zf_Z(z)dz
FZ(z)=∫−∞zfZ(z)dz
可得
f
Z
(
z
)
=
∫
−
∞
+
∞
f
(
x
,
z
−
x
)
d
x
f_Z(z)=\int_{-\infty}^{+\infty}f(x,z-x)dx
fZ(z)=∫−∞+∞f(x,z−x)dx
注意:有时候不光是题中给出的 x x x或 y y y的范围,还应注意表达式 x + y = z x+y=z x+y=z中 x x x的范围(本人亲测,做题时忘了这个,困扰了我好久)
由
X
X
X和
Y
Y
Y地位的对称性,可得
f
Z
(
z
)
=
∫
−
∞
+
∞
f
(
z
−
y
,
y
)
d
y
f_Z(z)=\int_{-\infty}^{+\infty}f(z-y,y)dy
fZ(z)=∫−∞+∞f(z−y,y)dy
特别地,若
X
X
X、
Y
Y
Y相互独立,上面两个结论又可写成
f
Z
(
z
)
=
∫
−
∞
+
∞
f
X
(
x
)
f
Y
(
z
−
x
)
d
x
f_Z(z)=\int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)dx
fZ(z)=∫−∞+∞fX(x)fY(z−x)dx
f
Z
(
z
)
=
∫
−
∞
+
∞
f
X
(
z
−
y
)
f
Y
(
y
)
d
y
f_Z(z)=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)dy
fZ(z)=∫−∞+∞fX(z−y)fY(y)dy
做题方法总结:
- 可直接对关系式表示的区域进行二重积分得到 F Z ( z ) F_Z(z) FZ(z),在求导得 f Z ( z ) f_Z(z) fZ(z)
- 可用上述结论进行一重积分直接得到 f Z ( z ) f_Z(z) fZ(z)
☁️ Z=max{X,Y}和Z=min{X,Y}的分布
先说明上述两式的实际意义:
-
例如,假设某地区降水量集中在7、8月,该地区的某条河这两个月的最高洪峰分别为 X X X和 Y Y Y,为制定防洪设施的安全标准,就需要知道 X X X、 Y Y Y中更大的一个洪峰并以此为安全标准,于是我们就需要求得 Z = m a x { X , Y } Z=max\{X,Y\} Z=max{X,Y}的分布。
-
又例如,在河流航运中我们最担心的是水量太小而停航,若记 X X X和 Y Y Y分别为某条河流一年中最小的两个月的流量,则 Z = m i n { X , Y } Z=min\{X,Y\} Z=min{X,Y}就是一年中的最小流量。
下面相继给出它们的定义。
设 X X X与 Y Y Y是相互独立的随机变量,分布函数分别为 F X ( x ) F_X(x) FX(x)和 F Y ( y ) F_Y(y) FY(y)。
- Z = m a x { X , Y } Z=max\{X,Y\} Z=max{X,Y}
F
m
a
x
(
z
)
=
P
{
Z
≤
z
}
=
P
{
X
≤
z
,
Y
≤
z
}
=
P
{
X
≤
z
}
P
{
Y
≤
z
}
=
F
X
(
x
)
F
Y
(
y
)
F_{max}(z)=P\{Z\leq z\}=P\{X\leq z,Y\leq z\}=P\{X\leq z\}P\{Y\leq z\}=F_X(x)F_Y(y)
Fmax(z)=P{Z≤z}=P{X≤z,Y≤z}=P{X≤z}P{Y≤z}=FX(x)FY(y)
即:
F m a x ( z ) = F X ( x ) F Y ( y ) F_{max}(z)=F_X(x)F_Y(y) Fmax(z)=FX(x)FY(y)
- Z = m i n { X , Y } Z=min\{X,Y\} Z=min{X,Y}
F
m
i
n
(
z
)
=
P
{
Z
≤
z
}
=
1
−
P
{
Z
>
z
}
F_{min}(z)=P\{Z\leq z\}=1-P\{Z >z\}
Fmin(z)=P{Z≤z}=1−P{Z>z}
而
P
{
Z
>
z
}
=
P
{
X
>
z
,
Y
>
z
}
=
[
1
−
P
{
X
≤
z
}
]
[
1
−
P
{
Y
≤
z
}
]
=
[
1
−
F
X
(
x
)
]
[
1
−
F
Y
(
y
)
]
P\{Z>z\}=P\{X>z,Y>z\}=[1-P\{X\leq z\}][1-P\{Y\leq z\}]=[1-F_X(x)][1-F_Y(y)]
P{Z>z}=P{X>z,Y>z}=[1−P{X≤z}][1−P{Y≤z}]=[1−FX(x)][1−FY(y)]
所以
F
m
i
n
(
z
)
=
1
−
[
1
−
F
X
(
x
)
]
[
1
−
F
Y
(
y
)
]
F_{min}(z)=1-[1-F_X(x)][1-F_Y(y)]
Fmin(z)=1−[1−FX(x)][1−FY(y)]
概念问题其实不用纠结太多,记住结论会应用就好。
💦 题目分析
- 设二维随机向量
(
X
,
Y
)
(X,Y)
(X,Y)的概率密度函数为
f
(
x
,
y
)
=
{
2
−
x
−
y
,
0
<
x
<
1
,
0
<
y
<
1
0
,
其它
f(x,y)=\begin{cases} 2-x-y~~~,0<x<1,0<y<1\\ 0~~~~~~~~~~~~~~~~~,其它\\ \end{cases}
f(x,y)={2−x−y ,0<x<1,0<y<10 ,其它
求 Z = X + Y Z=X+Y Z=X+Y的概率密度函数
题目分析:
- 首先我们需要先确定 z z z的分区,由题知, x x x、 y y y组成的积分区域为一个矩形,而 Z = X + Y Z=X+Y Z=X+Y则是一条直线, Z Z Z的值就是这条直线与 y y y轴的交点或与 x x x轴的交点,也就是随着 Z Z Z的值的变化,这条直线作平移。
- 只有当这条直线穿过这个矩形, f Z ( z ) f_Z(z) fZ(z)才有具体的值,否则为0,如下图:
- 由图知,当 z ≤ 0 z\leq 0 z≤0或 z ≥ 0 z\geq0 z≥0时,这条直线没有穿过这个矩形(因为是连续型的,所以 < = ≤ <=\leq <=≤),所以 f Z ( z ) = 0 f_Z(z)=0 fZ(z)=0
- 那是不是剩下的就可以分为 0 < z < 2 0<z<2 0<z<2了呢?,注意,在 0 < z ≤ 1 0<z\leq 1 0<z≤1时,积分区域还是个三角形,当 1 < z < 2 1<z<2 1<z<2时,积分区域就变成了五边形了!所以要把剩余的这个区间分为两个部分
- 于是,当 0 < z < 1 0<z<1 0<z<1时,有 f Z ( z ) = ∫ 0 z f ( x , z − x ) d x f_Z(z)=\int_0^zf(x,z-x)dx fZ(z)=∫0zf(x,z−x)dx(可将 z z z视作在 x x x轴上的点,然后将它在 x x x轴上平移,此时又因为 Z = X + Y Z=X+Y Z=X+Y,所以平移直线时, x x x未超出它的区间)
- 当 1 ≤ z < 2 1\leq z<2 1≤z<2时,有 f Z ( z ) = ∫ z − 1 1 f ( x , z − x ) d x f_Z(z)=\int_{z-1}^1f(x,z-x)dx fZ(z)=∫z−11f(x,z−x)dx(此时 z z z已经超过了 x x x的区间,但仍要使 0 < x < 1 0<x<1 0<x<1,那么就可以将 ( 1 , 0 ) (1,0) (1,0)视为该直线的起点,而后继续平移。这时 z − 1 < x < 1 z-1<x<1 z−1<x<1就在 x x x的区间了)
这一期因为这个比较难实现,所以就做一个知识总结~~