Change of Random Vectors
介绍一个很有用的知识点—— 变量代换 (变量替换;change of variables):
定理
X
X
X 是定义在
(
R
p
,
B
(
R
p
)
)
(\mathbb{R}^p,\mathcal{B}(\mathbb{R}^p))
(Rp,B(Rp))上的 随机向量,他的 cdf 是
F
X
F_X
FX,density 是
f
X
f_X
fX。假设存在一个变换
g
g
g,
Y
=
g
(
X
)
Y=g(X)
Y=g(X),使得
Y
Y
Y 也是
(
R
p
,
B
(
R
p
)
)
(\mathbb{R}^p,\mathcal{B}(\mathbb{R}^p))
(Rp,B(Rp)) 上的随机向量。这里,
g
g
g 是一个 1-1 的映射且存在连续的偏导数 (i.e.,
g
∈
C
1
g\in C^1
g∈C1)。定义 Jacobian矩阵
J
(
x
→
y
)
=
(
∂
x
i
∂
y
j
)
i
j
=
(
∂
g
i
−
1
(
y
)
∂
y
j
)
i
j
J(x\rightarrow y)=(\frac{\partial x_i}{\partial y_j})_{ij}=(\frac{\partial g_i^{-1}(y)}{\partial y_j})_{ij}
J(x→y)=(∂yj∂xi)ij=(∂yj∂gi−1(y))ij。那么,我们有
f
Y
(
y
)
=
f
X
(
g
−
1
(
y
)
)
∣
J
(
x
→
y
)
∣
.
f_Y(y) = f_X(g^{-1}(y))|J(x\rightarrow y)|.
fY(y)=fX(g−1(y))∣J(x→y)∣.
一个 informal 证明
对任意的函数
h
:
R
p
→
R
h: \mathbb{R}^p\rightarrow \mathbb{R}
h:Rp→R,我们有
E
[
h
(
Y
)
]
=
E
[
h
(
g
(
X
)
)
]
=
∫
⋯
∫
R
h
(
g
(
x
)
)
f
X
(
x
)
d
x
1
d
x
2
⋯
d
x
p
=
x
=
g
−
1
(
y
)
∫
⋯
∫
R
h
(
y
)
f
X
(
g
−
1
(
y
)
)
∣
J
(
x
→
y
)
∣
d
y
1
d
y
2
⋯
d
y
p
.
E[h(Y)] = E[h(g(X))]=\int\cdots\int_{\mathbb{R}} h(g(x)) f_X(x)dx_1dx_2\cdots dx_p\overset{x=g^{-1}(y)}{=}\int\cdots\int_{\mathbb{R}} h(y)f_X(g^{-1}(y))\left|J(x\rightarrow y)\right|dy_1dy_2\cdots dy_p.
E[h(Y)]=E[h(g(X))]=∫⋯∫Rh(g(x))fX(x)dx1dx2⋯dxp=x=g−1(y)∫⋯∫Rh(y)fX(g−1(y))∣J(x→y)∣dy1dy2⋯dyp.最后一个等式是 principle of multiple integrals 的结果。因此,自然有
f
Y
(
y
)
=
f
X
(
g
−
1
(
y
)
)
∣
J
(
x
→
y
)
∣
f_Y(y)=f_X(g^{-1}(y))|J(x\rightarrow y)|
fY(y)=fX(g−1(y))∣J(x→y)∣。
例子 - Polar Transformation of Gaussian
假设
X
1
X_1
X1 和
X
2
X_2
X2 是随机变量且有
(
X
1
X
2
)
∼
N
2
(
(
μ
1
μ
2
)
,
(
1
0
0
1
)
)
.
\left(\begin{array}{l} X_{1} \\ X_{2} \end{array}\right) \sim N_{2}\left(\left(\begin{array}{l} \mu_{1} \\ \mu_{2} \end{array}\right),\left(\begin{array}{ll} 1 & 0 \\ 0 & 1 \end{array}\right)\right).
(X1X2)∼N2((μ1μ2),(1001)).
令
X
1
=
R
cos
θ
X_1=R\cos\theta
X1=Rcosθ,
X
2
=
R
sin
θ
X_2=R\sin\theta
X2=Rsinθ。同样地,我们有
R
2
=
X
1
2
+
X
2
2
R^2=X_1^2+X_2^2
R2=X12+X22,
tan
θ
=
X
2
X
1
\tan\theta=\frac{X_2}{X_1}
tanθ=X1X2。如果我们定义
g
:
(
X
1
,
X
2
)
→
(
R
,
θ
)
g: (X_1,X_2)\rightarrow (R,\theta)
g:(X1,X2)→(R,θ),显然
g
g
g 不是 1-1 的,因为
(
R
,
θ
)
(R,\theta)
(R,θ) 和
(
−
R
,
θ
+
2
π
)
(-R,\theta+2\pi)
(−R,θ+2π) 有同样的原像。因此我们把
(
R
,
θ
)
(R,\theta)
(R,θ) 的取值限制在
Ω
=
[
0
,
+
∞
]
×
[
0
,
2
π
]
\Omega = [0,+\infty]\times[0,2\pi]
Ω=[0,+∞]×[0,2π] 上,这样
g
:
R
×
R
→
Ω
g: \mathbb{R}\times\mathbb{R}\rightarrow \Omega
g:R×R→Ω 就是 1-1 的了。由第一节的定理,我们有
J
(
(
x
1
,
x
2
)
→
(
r
,
θ
)
)
=
(
∂
x
1
∂
r
∂
x
1
∂
θ
∂
x
2
∂
r
∂
x
2
∂
θ
)
=
(
cos
θ
−
r
sin
θ
sin
θ
cos
θ
)
.
J((x_1,x_2)\rightarrow(r,\theta))=\left(\begin{array}{ll}\frac{\partial x_1}{\partial r} & \frac{\partial x_1}{\partial \theta}\\ \frac{\partial x_2}{\partial r} & \frac{\partial x_2}{\partial \theta} \end{array}\right)=\left(\begin{array}{rr}\cos\theta & -r\sin\theta\\ \sin\theta & \cos\theta \end{array}\right).
J((x1,x2)→(r,θ))=(∂r∂x1∂r∂x2∂θ∂x1∂θ∂x2)=(cosθsinθ−rsinθcosθ). 因此
∣
J
(
(
x
1
,
x
2
)
→
(
r
,
θ
)
)
∣
=
r
|J((x_1,x_2)\rightarrow(r,\theta))|=r
∣J((x1,x2)→(r,θ))∣=r. 于是,
(
R
,
θ
)
(R,\theta)
(R,θ) 的联合分布为
f
R
,
θ
(
r
,
θ
)
=
f
X
1
,
X
2
(
r
sin
θ
,
r
cos
θ
)
⋅
r
=
r
2
π
exp
(
−
0.5
(
r
sin
θ
−
μ
1
)
2
−
0.5
(
r
cos
θ
−
μ
2
)
2
)
.
f_{R,\theta}(r,\theta)=f_{X_1,X_2}(r\sin\theta,r\cos\theta)\cdot r=\frac{r}{2\pi}\exp(-0.5(r\sin\theta-\mu_1)^2-0.5(r\cos\theta-\mu_2)^2).
fR,θ(r,θ)=fX1,X2(rsinθ,rcosθ)⋅r=2πrexp(−0.5(rsinθ−μ1)2−0.5(rcosθ−μ2)2). 如果
μ
1
=
μ
2
=
0
\mu_1=\mu_2=0
μ1=μ2=0,
f
R
,
θ
f_{R,\theta}
fR,θ 简化为
f
R
,
θ
(
r
,
θ
)
=
r
2
π
exp
(
−
0.5
r
2
)
.
f_{R,\theta}(r,\theta)=\frac{r}{2\pi} \exp(-0.5r^2).
fR,θ(r,θ)=2πrexp(−0.5r2). 简单计算一下:
∫
0
∞
r
exp
(
−
0.5
r
2
)
=
1.
\int_{0}^\infty r\exp(-0.5 r^2)=1.
∫0∞rexp(−0.5r2)=1.Perfect。所以,
R
R
R 的 marginal density 是
f
R
(
r
)
=
r
2
π
exp
(
−
0.5
r
2
)
,
f_R(r)=\frac{r}{2\pi} \exp(-0.5r^2),
fR(r)=2πrexp(−0.5r2),
θ
\theta
θ 在
[
0
,
2
π
]
[0,2\pi]
[0,2π] 上均匀分布。