通常随机实验,建立在样本空间上的随机变量不会只有一个,比如研究一个家庭的生活水平,不但观察月收入,还要观察月支出。
一般,如果X,Y是定义在样本空间S上的随机变量,那么(X,Y)称为二维随机变量(或称二维随机向量),类似可以定义n维随机变量。
定义:设二维随机变量(X,Y)所有可能的取值为(xi,yj),(i,j=1,2,3…);(X,Y)取(xi,yj)的概率为pij,称
P{X=xi,Y=yj}=pij为二维随机变量(X,Y)的分布律,也称为X和Y的联合分布律。
显然pij>=0
∑
1
∞
∑
1
∞
p
i
j
=
1
\sum_{1}^{∞}\sum_{1}^{∞}p_{ij}=1
∑1∞∑1∞pij=1
同理,对于连续型随机变量,有
∬
−
∞
∞
f
(
x
,
y
)
d
x
d
y
=
1
\iint_{-∞}^{∞}{f(x,y)dxdy}=1
∬−∞∞f(x,y)dxdy=1
(X,Y)落在某一区域G的概率P{(X,Y)∈G}=
∬
G
f
(
x
,
y
)
d
x
d
y
\iint_{G}^{}{f(x,y)dxdy}
∬Gf(x,y)dxdy
同理,可以定义二维连续随机变量的分布函数
F(x,y)=P{(X≦x)∩(Y≦y)}=P{X≦x,Y≦y}称作二维随机变量的分布函数
F(x,y)值描述的是二维随机变量落在下图阴影区的概率:
上面讲的是联合分布,对于二维随机变量,自然也会有X,Y各自单独的分布,称为边缘分布。
对于离散型随机变量,由于可以看作一个矩阵:如图:
Y/X | y1 | y2 | y3 | … | yn |
---|---|---|---|---|---|
x1 | p11 | p12 | p13 | … | p1n |
x2 | p21 | p22 | p23 | … | p2n |
x3 | p31 | p32 | p33 | … | p3n |
… | … | … | … | … | … |
xi | pi1 | pi2 | pi3 | … | pin |
… | … | … | … | … | … |
xm | pm1 | pm2 | pm3 | … | pmn |
很显然,单纯研究X=xi时候,P{X=xi}=pi1+pi2+pi3+…+pim=
∑
j
=
1
m
p
i
j
\sum_{j=1}^{m}p_{ij}
∑j=1mpij
同理推出:
P{Y=yj}=p1j+p2j+p3j+…+pnj=
∑
i
=
1
n
p
i
j
\sum_{i=1}^{n}p_{ij}
∑i=1npij
二维连续性随机变量也类似,只不过连加变成积分而已。对于P{X=xi}是对y积分,P{Y=yj}是对x积分。比如,已知(X,Y)是连续型随机二维变量,而且其概率密度函数为f(x),求X在[a,b]区间的概率,计算公式为:
∫
a
b
[
∫
−
∞
∞
f
(
x
,
y
)
d
y
]
d
x
\int_{a}^{b}[\int_{-∞}^{∞} f(x,y)dy]dx
∫ab[∫−∞∞f(x,y)dy]dx
二维随机变量的条件分布
二维随机变量的条件分布从概率的条件分布而来,研究的是当xi或者yj已知的条件下,yj或xi的分布规律,借助概率的条件分布表达式,可以写出形如下面的二维随机变量条件分布表达式:
P{Y=yj|X=xi}=
P
{
X
=
x
i
,
Y
=
y
j
}
P
{
X
=
x
i
}
(
j
=
1
,
2
,
3...
)
\frac{P\left \{ X=x_i,Y=y_j\right \}}{P\left \{ X=x_i \right \}} \quad \quad (j=1,2,3...)
P{X=xi}P{X=xi,Y=yj}(j=1,2,3...)
以上公式描述为:设(X,Y)的概率密度为f(x,y),边缘概率密度分别为fx(x)和fy(y),则条件概率密度fY|X(y|x)=
f
(
x
,
y
)
f
x
(
x
)
\frac{f(x,y)}{f_{x}(x)}
fx(x)f(x,y),也即:f(x,y)=fx(x)*fY|X(y|x)=fy(y)*fX|Y(x|y)
上面的公式推导原理如下:
对于离散型随机变量,我们可以计算X=xi时候yj的概率,但是对于连续性随机变量,无论对于xi还是yj,由于积分都是0(由于是某一个点,积分区间是0,所以积分也是0)不是直接套用离散型的公式,但是借助微分和极限的方法,我们可以如下求近似值:P(a≦Y≦b,x≦X≦x+ε)ε→0=
P
(
x
⩽
X
⩽
x
+
ε
,
a
⩽
Y
⩽
b
)
P
{
x
⩽
X
⩽
x
+
ε
}
\frac{P\left ( x\leqslant X\leqslant x+\varepsilon ,a\leqslant Y\leqslant b\right )}{P\left \{ x\leqslant X\leqslant x+\varepsilon\right \}}
P{x⩽X⩽x+ε}P(x⩽X⩽x+ε,a⩽Y⩽b)=$$
公式编辑好麻烦好累啊。手写看图吧:
上图中的F称为已知X=x条件下Y的条件分布函数
我们可以推出FY|X(y|x)=
∫
−
∞
x
f
Y
∣
X
(
y
∣
x
)
d
y
\int_{-\infty }^{x}{f_{Y|X} \left ( y|x \right )}d_y
∫−∞xfY∣X(y∣x)dy
FY|X(y|x)=fy|x(y|x)对于y积分