机器学习-白板推导 P2_4

最新推荐文章于 2023-07-29 14:09:01 发布

无知书童

最新推荐文章于 2023-07-29 14:09:01 发布

阅读量218

点赞数

分类专栏： # 机器学习白板推导文章标签：高斯分布边缘概率

本文链接：https://blog.csdn.net/qq_28404829/article/details/100567529

版权

机器学习白板推导专栏收录该内容

25 篇文章 1 订阅

订阅专栏

机器学习-白板推导 P2_4

已知高维高斯分布，求边缘概率分布和条件概率分布

\begin{bmatrix} x_{1} \\ x_{2} \\ \vdots \\ x_{p} \end{bmatrix} \qquad \mu= \begin{bmatrix} \mu_{1} \\ \mu_{2} \\ \vdots \\ \mu_{p} \end{bmatrix} \qquad \Sigma= \begin{bmatrix} \sigma_{11} &amp; \sigma_{12} &amp; \cdots &amp;\sigma_{1p} \\ \sigma_{21} &amp; \sigma_{22} &amp; \cdots&amp;\sigma_{2p} \\ \vdots &amp; \vdots &amp; \ddots &amp; \vdots \\ \sigma_{p1} &amp; \sigma_{p2} &amp; \cdots &amp;\sigma_{pp} \end{bmatrix}_{p \times p }

已知：
把

p

维向量分成两组，

x_a \in R^m, x_b \in R ^n, m+n = p

把

x

看成

x_a,x_b

的联合概率分布

\begin{bmatrix} x_{a} \\ x_{b} \end{bmatrix} \qquad \mu= \begin{bmatrix} \mu_{0} \\ \mu_{1} \end{bmatrix} \qquad \Sigma= \begin{bmatrix} \Sigma_{aa} &amp; \Sigma_{ab} \\ \Sigma_{ba} &amp; \Sigma_{bb} \end{bmatrix}

求：

p(x_a)

p(x_b|x_a)

p(x_b)

p(x_a|x_b)

配方法->PRML 这里不用

定理：
已知： $\sim N(\mu, \Sigma)$ , $y = A x + B$
结论： $\sim N(A\mu+B,A\Sigma A^T)$
$E[y]=E[Ax+B]=AE[x]+B=A\mu+B$
$Var[y]=Var[Ax+B]=Var[Ax]+Var[B]=AVar[x]A^T=A\Sigma A^T$

$p(x_a)$ 公式推理：
$\begin{aligned} & x_a= \begin{bmatrix} I_m & 0_n \end{bmatrix} \begin{bmatrix} x_a \\ x_b \end{bmatrix} \\ &E[x_a]= \begin{bmatrix} I_m & 0_n \end{bmatrix} \begin{bmatrix} u_a \\ u_b \end{bmatrix}=u_a \\ & Var[x_a]= \begin{bmatrix} I_m & 0_n \end{bmatrix} \begin{bmatrix} \Sigma_{aa} & \Sigma_{ab} \\ \Sigma_{ba} & \Sigma_{bb} \end{bmatrix} \begin{bmatrix} I_m \\ 0_n \end{bmatrix} = \begin{bmatrix} \Sigma_{aa} & \Sigma_{bb} \end{bmatrix} \begin{bmatrix} I_m\\ 0\end{bmatrix} = \Sigma_{aa} \\ &x_a \sim (\mu_a, \Sigma_{aa}) \end{aligned}$

$p(x_b|x_a)$ 公式推理：
定义变量：
$x_{b.a}=x_b-\Sigma_{ba}\Sigma_{aa}^{-1}x_a$ 不要问为什么
$\mu_{b.a}=\mu_b-\Sigma_{ba}\Sigma_{aa}^{-1}\mu_a$
$\Sigma_{bb.a}=\Sigma_{bb}-\Sigma_{ba}\Sigma_{aa}^{-1}\Sigma_{ab}$ $\qquad$ schur complementary
设：
$\begin{aligned} &x_{b.a}=\begin{bmatrix} -\Sigma_{ba}\Sigma_{aa}^{-1} & I \end{bmatrix} \begin{bmatrix} x_a \\ x_b \end{bmatrix}\\ &E[x_{b.a}] = \begin{bmatrix} -\Sigma_{ba}\Sigma_{aa}^{-1} & I \end{bmatrix} \begin{bmatrix} u_a \\ u_b \end{bmatrix} = \mu_b-\Sigma_{ba}\Sigma_{aa}^{-1}\mu_a = \mu_{b.a} \\ &Var[x_{b.a}]=\begin{bmatrix} -\Sigma_{ba}\Sigma_{aa}^{-1} & I \end{bmatrix} \begin{bmatrix} \Sigma_{aa} & \Sigma_{ab} \\ \Sigma_{ba} & \Sigma_{bb} \end{bmatrix}\begin{bmatrix} -\Sigma_{ba}\Sigma_{aa}^{-1} \\ I \end{bmatrix} \\ &= \begin{bmatrix} 0 & \Sigma_{bb}-\Sigma_{ba}\Sigma_{aa}^{-1}\Sigma_{ab} \end{bmatrix} \begin{bmatrix} -\Sigma_{ba}\Sigma_{aa}^{-1} \\ I \end{bmatrix} \\ &=\Sigma_{bb}-\Sigma_{ba}\Sigma_{aa}^{-1}\Sigma_{ab} \\ &=\Sigma_{bb.a} \\ &x_{b.a} \sim N(\mu_{b.a},\Sigma_{bb.a}) \end{aligned}$
已知
$x_{b.a} \sim N(\mu_{b.a},\Sigma_{bb.a})$
$x_{b.a}=x_b-\Sigma_{ba}\Sigma_{aa}^{-1}x_a$
$x_{b}=x_{b.a}+\Sigma_{ba}\Sigma_{aa}^{-1}x_a$
$y = A x + B$
$y=x_{b},A=1,x=x_{b.a},B=\Sigma_{ba}\Sigma_{aa}^{-1}x_a$
结论
$E[x_b|x_a]=\mu_{b.a}+\Sigma_{ba}\Sigma_{aa}^{-1}x_a$
$Var[x_b|x_a]=Var[x_{b.a}]=\Sigma_{bb.a}$
$x_b|x_a \sim N(\mu_{b.a}+\Sigma_{ba}\Sigma_{aa}^{-1}x_a,\Sigma_{bb.a})$