(X1,X2) 是随机向量,假设我们知道 (X1,X2) 的联合分布而我们想求 (X1,X2) 变换的分布,假设为 Y=g(X1,X2) ,我们通过得到 Y 的cdf即可去除。还有种方式是使用变换,考虑前面讲过的变换理论,本篇文章将其扩展到随机向量。最好的方式是分开讨论离散与连续的情况,我们首先讨论离散情况。
令
其中 x1=w1(y1,y2),x2=w2(y1,y2) 是 y1=u1(x1,x2),y2=u2(x1,x2) 的单值逆,根据 pY1,Y2(y1,y2) 的联合pmf,我们通过对 y2 求和得到 Y1 的边缘pmf 或者对 y1 求和得到 Y2 的边缘pmf。
在变换变换方法中,需要强调的是我们需要两个新变量代替两个旧变量,下面给出实例。
例1:
X1,X2
的联合pmf为
其他地方为零,其中
μ1,μ2
是确定的正实数,因此空间
S
是点
(x1,x2)
的集合,其中
x1,x2
均是非负实数,我们希望求出
y1=X1+X2
的pmf。如果我们使用变量代换,那么我们需要定义第二个随机变量
Y2
,因为我们对
Y2
不感兴趣,所以我们选择一种简单的一对一变换,例如取
Y2=X2
,那么
y1=x1+x2,y2=x2
表示将空间
S
映射到
的一对一变换。注意,如果
(y1,y2)∈T
,那么
0≤y2≤y1
,逆函数为
x1=y1−y2,x2=y2
,所以
Y1,Y2
的联合pmf为
其他地方为零。因此
Y1
的边缘pmf为
其他地方为零。
对于连续情况,我们从实例开始讲解,
例2:
考虑从单位正方形
S={(x,y):0<x<1,0<y<1}
中随机选择点
(X,Y)
,假设我们感兴趣的既不在
X
中也不是
它描述了概率模型。接下里
Z
的cdf表示成
因为对于所有的
z
值
现在我们讨论连续情况的一般变换方法,
(X1,X2)
有联合连续分布,其pdf为
fX1,X2(x1,x2)
,支撑集为
S
。假设随机变量
Y1,Y2
为
Y1=u1(X1,X2),Y2=u2(X1,X2)
,其中函数
y1=u1(x1,x2),y2=u2(x1,x2)
定义了从集合
S
到
T
上的一对一变换,其中
T
是
(Y1,Y2)
的支撑。如果我们用
y1,y2
来表示
x1,x2
,那么我们可以写成
x1=w1(y1,y2),x2=w2(y1,y2)
,行列式
称为变换的雅克比,用符号
J
表示,假设这些一阶偏导是连续的并且雅克比
利用分析中的定理,我们能找出
(Y1,Y2)
的联合pdf,令
A
是
图1
因为变换是一对一的,所以事件
{(X1,X2)∈A},{(Y1,Y2)∈B}
是等价的,故
我们想用
y1=u1(x1,x2),y2=u2(x1,x2)
或者
x1=w1(y1,y2),x2=w2(y1,y2)
替换积分变量,那么根据分析中的知识可得
因此,对于
T
中的每个集合
B
这表明
Y1,Y2
的联合pdf
fY1,Y2(y1,y2)
为
Y1 的边缘pdf fY1(y1) 可以通过在 y2 上积分联合pdf fY1,Y2(y1,y2) 得到,下面给出一些例子。
例3:
假设
(X1,X2)
有联合pdf
那么 (X1,X2) 的支撑是集合 S={(x1,x2):0<x1<1,0<x2<1} ,如图2所示。
假设
Y1=X1+X2,Y2=X1−X2
,变换为
这个变换是一对一的,我们首先确定
y1y2
平面中的集合
T
,也就是该变换下
S
的映射,那么
为了确定
S
在
y1y2
平面上对应的
T
,注意
S
的边界被变换成如下
T
的边界:
图2
因此
T
如图3所示,接下来雅克比为
虽然建议变换
S
的边界,但是许多人直接使用不等式
那么四个不等式变成
很容易看出这些等价于
他们定义了集合
T
。
图3
因此
(Y1,Y2)
的联合pdf为
Y1
的边缘pdf为
如果参考图3,可以看出
同样的,我们可以得出
fY2(y2)
的边缘pdf为
例4:
令
Y−1=12(X1−X2)
,其中
X1,X2
有联合pdf,
令
Y2=X2
使得
y1=12(x1−x2),y2=x2
或者等价的
x1=2y1+y2,x2=y2
定义了从
S={(x1,x2):0<x1<∞,0<x2<∞}
到
T={(y1,y2):−2y1<y2,0<y2,−∞<y1<∞}
的一对一变换,该变换的雅克比为
因此
Y1,Y2
的联合pdf为
因此
Y1
的pdf为
或者
这个pdf称为双指数或拉普拉斯pdf。
例5:
X1,X2
有联合pdf
假设
Y1=X1/X2,Y2=X2
,那么逆变换是
x1=y1y2,x2=y2
,其雅克比为
定义在
(X1,X2)
支撑
S
上的不等式变为
这些不等式等价于定义在
(Y1,Y2)
支撑集
T
上的
因此
(Y1,Y2)
的联合pdf为
边缘pdf为:
其余地方为零,
其余地方为零。
除了用变量变换与cdf来求随机变量函数的分布外,还有一种方法叫矩生成函数,特别适合随机变量的线性函数。前篇文章讲过,如果
Y=g(X1,X2)
,那么如果
E(Y)
存在的话,对于连续情况它等于
离散情况只需将积分符号替换成求和即可。当然函数 g(X1,X2) 可以是 exp{tu(X1,X2)} ,这样的话我们就找出了函数 Z=u(X1,X2) 的mgf,如果我们将这个mgf看成某个分布,那么 Z 就满足此分布。接下来给出俩个例子说明这个方法。
其中
μ1,μ2
是固定的正实数,令
Y=X1+X2
,考虑
注意倒数第二行中括号中的分别是
X1,X2
的mgf,因此
Y
的mgf与
例7:
X1,X2
的联合pdf为
所以
Y=(1/2)(X1−X2)
的mgf为
假设
1−t>0,1+t>0
;即
−1<t<1
,然而双指数分布的mgf为
假设 −1<t<1 ,因此根据mgf的唯一性, Y <script type="math/tex" id="MathJax-Element-13319">Y</script>满足双指数分布。