漫步数理统计二十一——变换:随机向量

前面的文章中提到,两个连续型随机变量的两个函数联合pdf 的行列式基本上是数学分析中处理二重积分变换变换时一个定理的推论,这个定理自然可以扩展到 n 重积分,考虑n维空间 S 的子集 A 上的积分形式

Ah(x1,x2,,xn)dx1dx2dxn


y1=u1(x1,x2,,xn),y2=u2(x1,x2,,xn),,yn=un(x1,x2,,xn)

是将 S 映射到 y1,y2,,yn 所在 T 空间的一对一变换,因此就将 S 的子集 A 映射到T的子集 B ,另外其逆函数为

x1=w1(y1,y2,,yn),x2=w2(y1,y2,,yn),,xn=wn(y1,y2,,yn)

。令逆函数的一阶偏导为连续的且 n×n 的行列式(称为雅克比)

J=x1y1x2y1xny1x1y2x2y2xny2x1ynx2ynxnyn

不等于 T 中的零,那么

Ah(x1,x2,,xn)dx1dx2dxn=Bh[w1(y1,,yn),w2(y1,,yn),,wn(y1,,yn)]|J|dy1dy2dyn

只要这个定理的条件满足,我们就能确定 n 个随机变量的n个函数的联合pdf。

1 X1,X2X3 的联合pdf为

h(x1,x2,x3)={48x1x2x300<x1<x2<x3<1elsewhere

如果 Y1=X1/X2,Y2=X2/X3,Y3=X3 ,那么逆变换为

x1=y1y2y3,x2=y2y3,x3=y3

雅克比为

J=y2y300y1y3y30y1y2y21=y2y23

定义在支撑上的不等式等价于

0<y1y2y3,y1y2y3<y2y3,y2y3<y3,y3<1

变为 Y1,Y2,Y3 的支撑 T={(y1,y2,y3):0<yi<1,i=1,2,3} 。因此 Y1,Y2,Y3 的联合pdf为

g(y1,y2,y3)=48(y1y2y3)(y2y3)y3|y2y23|={48y1y32y5300<yi<1,i=1,2,3elsewhere

边缘pdf为

g1(y1)=2y1,0<y1<1,zero elsewhere,g2(y2)=4y32,0<y2<1,zero elsewhere,g3(y3)=6y53,0<y3<1,zero elsewhere

因为 g(y1,y2,y3)=g1(y1)g2(y2)g3(y3) ,所以随机变量 Y1,Y2,Y3 互相独立。

2 X1,X2,X3 是独立同分布的随机变量,其共同的pdf为

f(x)={ex00<x<elsewhere

所以 X1,X2,X3 的联合pdf为

fX1,X2,X3(x1,x2,x3)={eΣ3i=1xi00<xi<,i=1,2,3elsewhere

考虑随机变量 Y1,Y2,Y3 ,定义为

Y1=X1X1+X2+X3,Y2=X2X1+X2+X3,Y3=X1+X2+X3

因此逆变换为

x1=y1y3,x2=y2y3,x3=y3y1y3y2y3

其雅克比为

J=y30y30y3y3y1y21y1y2=y23

X1,X2,X3 的支撑映射到

0<y1y3<,0<y2y3<,0<y3(1y1y2)<

这等价于

T={(y1,y2,y3):0<y1,0<y2,0<1y1y2,0<y3<}

因此 Y1,Y2,Y3 的联合pdf为

g(y1,y2,y3)=y23ey3,(y1,y2,y3)T

Y1 的边缘pdf为

g1(y1)=1y100y23ey3dy3dy2=2(1y1),0<y1<1

其他地方为零。同样的 Y2 的边缘pdf为

g2(y2)=2(1y2), 0<y2<1

其他地方为零,而 Y3 的pdf为

g3(y3)=101y10y23ey3dy2dy1=12y23ey3, 0<y3<

其他地方为零。因为 g(y1,y2,y3)g1(y1)g2(y2)g3(y3) ,所以 Y1,Y2,Y3 是相关的随机变量。

然而,注意 Y1,Y3 的联合pdf为

g13(y1,y3)=1y10y21ey3dy2=(1y1)y23ey3, 0<y1<1,0<y3<

其他地方为零。因此 Y1,Y3 是独立的。同样可得 Y2,Y3 是独立的。因为 Y1,Y2 的联合pdf为

g12(y1,y2)=0y23ey3dy3=2, 0<y1,0<y2,y1+y2<1

其他地方为零, Y1,Y2 是独立的。

接下来我们考虑变换变量时遇到的其他问题。令 X 满足柯西pdf

f(x)=1π(1+x2), <x<

并令 Y=X2 ,我们现在要找 Y 的pdfg(y),考虑变换 y=x2 ,这个变换将 X 的空间S={x:<x<}映射到 T={y:0y<} 。然而变换不是一对一的,对于每个 yT (除了 y=0 ),他们对应两个点 xS 。例如,如果 y=4 ,那么要么 x=2 要么 x=2 。对于这样的例子,我们将 S 表示成两个不相交集合 A1,A2 的并,使得 y=x2 为将 A1,A2 映射到 T 上的一对一变换。如果取 A1 {x:<x<0},A2 {x:0x<} ,可以看出 A1 被映射到 {y:0<y<} A2 被映射到 {x:0y<} ,这些集合是不同的。困难在于 x=0 S 中的元素,那么我们为何不回到柯西pdf取 f(0)=0 呢?这样的话我们的 S={<x<,x0} ,就可以取 A1={x:<x<0},A2={x:0<x<} ,那么逆变换为 x=y y=x2 A1 映射到 T={x:0<x<} ,变换是一对一的。进一步,逆变换为 x=y y=x2 A2 映射到 T={y:0<y<} ,变换是一对一的。考虑概率 P(YB) ,其中 BT ,令 A3={x:x=y,yB}A1,A4={x:x=y,yB}A2 ,那么当且仅当 XA3 或者 XA4 YB ,所以我们有

P(YB)=P(XA3)+P(XA4)=A3f(x)dx+A4f(x)dx

对第一个积分,令 x=y ,那么雅克比 J1 1/2y ;进一步,集合 A3 被映射到 B 上。对第二个积分,令x=y,那么雅克比 J2 1/2y ;进一步,集合 A4 也别映射到 B 上。最终

P(YB)=Bf(y)12ydy+Bf(y)1ydy=B[f(y)+f(y)]12ydy

Y 的pdf为
g(y)=12y[f(y)+f(y)], yT

因为 f(x) 是柯西pdf,所以我们有

g(y)={1π(1+y)y00<y<elsewhere

前面这些连续型随机变量的讨论中,我们有两个逆函数 x=y,x=y ,这也是为什么我们要将 S 分成两个不相交的子集,从而使得变换 y=x2 将每个集合映射到 T 上。如果有三个逆函数,我们可以将 S 分成三个不相交的集合,等等。

h(x1,x2,,xn) 是连续型随机变量 X1,X2,,Xn 的联合pdf,令 S 表示 h(x1,x2,,xn)>0 n 维空间并考虑变换y1=u1(x1,x2,,xn),,yn=un(x1,x2,,xn),将 S 映射到 T 。对于 S 中的每个点只对应 T 中的一个点;但是 T 中的一个点可能对应 S 中的多个点,即变换不是一对一的。然而假设我们能用有限个互不相交的集合 A1,A2,,Ak 并表示 S ,使得

y1=u1(x1,x2,,xn),,yn=un(x1,x2,,xn)

Ai T 的一对一变换,那么 T 中的每个点只对应 A1,A2,,Ak 中的一个点。对 i=1,,k ,令

x1=w1i(y1,y2,,yn),x2=w2i(y1,y2,,yn),,xn=wni(y1,y2,,yn)

表示 k n个逆函数。令一阶偏导连续且每个

Ji=w1iy1w2iy1wniy1w1iy2w2iy2wniy2w1iynw2iynwniyn, i=1,2,,k

不等于 T 中的零。考虑 k 个互斥事件并的概率以及变量变换方法,可以看出Y1=u1(X1,X2,,Xn),Y2=u2(X1,X2,,Xn),,Yn=un(X1,X2,,Xn) 的联合pdf为

g(y1,y2,,yn)=i=1k|Ji|h[w1i(y1,,yn),,wni(y1,,yn)]

其他地方为零,这里假设 (y1,y2,,yn)T 。任何 Yi 的pdf,假设为 Y1

g1(y1)=g(y1,y2,,yn)dy2dyn

3 X1,X2 的联合pdf定义在单位圆上

f(x1,x2)={1π00<x21+x22<1elsewhere

Y1=X21+X22,Y2=X21/(X21+X22) ,那么 y1y2=x21,x22=y1(1y2) ,支撑 S 映射到 T={(y1,y2):0<yi<1,i=1,2} 。对每个有序数对 (y1,y2)T ,在 S 中有四个点

(x1,x2)使x1=y1y2,x2=y1(1y2)(x1,x2)使x1=y1y2,x2=y1(1y2)(x1,x2)使x1=y1y2,x2=y1(1y2)(x1,x2)使x1=y1y2,x2=y1(1y2)

第一个雅克比为

J1=12y2/y112(1y2)/y112y1/y212y1/(1y2)=141y2y2y21y2=141y2(1y2)

很容易看出这四个雅克比的绝对值都等于 1/4y2(1y2) 。因此 Y1,Y2 的联合pdf是这四项的和,可写成

g(y1,y2)=41π14y2(1y2)=1πy2(1y2),(y1,y2)T

所以 Y1,Y2 是独立的随机变量。

当然与二元情况一样,注意到如果 Y=g(X1,X2,,Xn) 是随机变量的函数,我们可以使用mgf方法,连续情况 Y 的mgf为

E(etY)=etg(x1,x2,,xn)h(x1,x2,,xn)dx1dx2dxn

其中 h(x1,x2,,xn) 是联合pdf。对于离散情况,只需要用求和符号代替积分即可,这个过程在处理独立随机变量的线性函数是非常有用。

4 X1,X2,X3 是独立的随机变量,联合pmf为

p(x1,x2,x3)={μx11μx22μx33eμ1μ2μ3x1!x2!x3!0xi=0,1,2,,i=1,2,3elsewhere

如果 Y=X1+X2+X3 ,那么 Y 的mgf为

E(etY)=E(et(X1+X2+X3))=E(etX1etX2etX3)=E(etX1)E(etX2)E(etX3)

因为 X1,X2,X3 是独立的,且之前的例子中已求出

E(etXi)=exp{μi(et1)},i=1,2,3

因此

E(etY)=exp{(μ1+μ2+μ3)(et1)}

然而这时pmf

pY(y)={μ1+μ2+μ3ye(μ1+μ2μ3)y!0y=0,1,2,elsewhere

所以这就是 Y=X1+X2+X3 的分布。

5 X1,X2,X3,X4 是独立的随机变量且共同的pdf为

f(x)={ex0x>0elsewhere

如果 Y=X1+X2+X3+X4 ,那么与上例一样, X1,X2,X3,X4 独立就意味着

E(etY)=E(etX1)E(etX2)E(etX3)E(etX4)

之前我们求出

E(etXi)=(1t)1,t<1,i=1,2,3,4

因此

E(etY)=(1t)4

随后我们会看到这就是pdf为

fY(y)={13!y3ey00<y<elsewhere

分布的mgf,因此这就是 Y <script type="math/tex" id="MathJax-Element-4242">Y</script>的分布。

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值