两个复高斯分布的乘积（高维）

Turbo-shengsong

已于 2022-03-27 09:50:03 修改

阅读量2.1k

点赞数 6

分类专栏：数学基础文章标签：线性代数矩阵概率论

于 2022-03-26 20:13:44 首次发布

本文链接：https://blog.csdn.net/weixin_43413559/article/details/123761846

版权

数学基础专栏收录该内容

20 篇文章 6 订阅

订阅专栏

假设 $p(\boldsymbol x) \propto \mathcal{CN}(\boldsymbol \mu_1, \boldsymbol \Sigma_1)\mathcal{CN}(\boldsymbol \mu_2, \boldsymbol \Sigma_2)$ ，有
$\begin{aligned} p(\boldsymbol x)&\propto \exp{\left \{ -{(\boldsymbol x - \boldsymbol \mu_1)^H \boldsymbol \Sigma^{-1}_1 (\boldsymbol x - \boldsymbol \mu_1)}{} -{(\boldsymbol x - \boldsymbol \mu_2)^H \boldsymbol \Sigma^{-1}_2 (\boldsymbol x - \boldsymbol \mu_2)}{} \right \}} \\ &\propto \exp{\left \{ -{\boldsymbol x^H \boldsymbol \Sigma^{-1}_1 \boldsymbol x + 2 \mathcal{R} \left \{\boldsymbol \mu^H_1 \boldsymbol \Sigma^{-1}_1 \boldsymbol x\right \}}{} - {\boldsymbol x^H \boldsymbol \Sigma^{-1}_2 \boldsymbol x + 2 \mathcal{R} \left \{\boldsymbol \mu^H_2 \boldsymbol \Sigma^{-1}_2 \boldsymbol x\right \}}{} \right \}} \\ &=\exp{\left \{ {-\boldsymbol x^H \left ( \boldsymbol \Sigma^{-1}_1 + \boldsymbol \Sigma^{-1}_2 \right ) \boldsymbol x + 2 \mathcal{R} \left \{ \left( \boldsymbol \mu^H_1 \boldsymbol \Sigma^{-1}_1 + \boldsymbol \mu^H_2 \boldsymbol \Sigma^{-1}_2 \right ) \boldsymbol x \right \}}{} \right \}} \\ & = \exp \left \{ - \left [\boldsymbol x^H \left [ \mathop {\underbrace{{\boldsymbol{\varSigma }_{1}^{-1}+\boldsymbol{\varSigma }_{2}^{-1}}{}}} \limits_{=\boldsymbol{\varSigma }_{x}^{-1}} \right ] \boldsymbol x - 2 \mathcal{ R } \left \{ \left[ \mathop {\underbrace{{\boldsymbol{\varSigma }_x\left( \boldsymbol{\varSigma }_{1}^{-1}\boldsymbol{\mu }_1+\boldsymbol{\varSigma }_{2}^{-1}\boldsymbol{\mu }_2 \right)}{}}} \limits_{=\boldsymbol{\mu }_x} \right] ^H \boldsymbol \Sigma^{-1}_x \boldsymbol x \right \} \right ]\right \} \\ &= \exp \left \{ - \left [\boldsymbol x^H \boldsymbol \Sigma^{-1}_x \boldsymbol x + 2 \mathcal{ R } \boldsymbol \mu^H_x \boldsymbol \Sigma^{-1}_x \boldsymbol x \right ] \right \} \\ & \propto \exp \left \{ - (\boldsymbol x - \boldsymbol \mu_x)^H \boldsymbol \Sigma^{-1} (\boldsymbol x - \boldsymbol \mu_x) \right \} \end{aligned}$
因此 $\sim \mathcal {CN}(\boldsymbol \mu_x, \boldsymbol \Sigma_x)$ ，其中
$\begin{aligned} \boldsymbol \mu_x & = \boldsymbol{\varSigma }_x\left( \boldsymbol{\varSigma }_{1}^{-1}\boldsymbol{\mu }_1+\boldsymbol{\varSigma }_{2}^{-1}\boldsymbol{\mu }_2 \right) \\ \boldsymbol \Sigma_x &= { \left (\boldsymbol \Sigma^{-1}_1 + \boldsymbol \Sigma^{-1}_2 \right )}^{-1} \end{aligned}$
注意，当 $\boldsymbol x$ 为标量 $x$ 时， $\sim \mathcal{CN}(\mu_x, \sigma_x)$
$\begin{aligned} \sigma_x &= {\left ( \frac{1}{\sigma^2_1}+\frac{1}{\sigma^2_2} \right )}^{-1}= \frac{\sigma^2_1 \sigma^2_2}{\sigma^2_1+\sigma^2_2}\\ \mu_x &= \frac{\sigma^2_1 \sigma^2_2}{\sigma^2_1+\sigma^2_2} \left ( \frac{\mu_1}{\sigma^2_1} + \frac{\mu_2}{\sigma^2_2} \right ) \end{aligned}$
然而，在实际编写代码的过程中，考虑到数值的稳定性，我们一般按照如下顺序执行：
$\begin{aligned} g & = \frac{\sigma^2_1 }{\sigma^2_1+\sigma^2_2} \\ \mu_x &= g \cdot (\mu_2 - \mu_1) + \mu_1 \\ \sigma_x &= g \cdot \sigma^2_1 \end{aligned}$

另外，考虑 $\textbf{常见的线性模型}$ ：
$\boldsymbol y = \boldsymbol {Ax} + \boldsymbol w$

其中 $\boldsymbol x$ 的先验分布： $\boldsymbol x \sim \mathcal {CN}(\boldsymbol x; \boldsymbol r, \boldsymbol \Sigma_1)$ ，似然分布 $\boldsymbol y | \boldsymbol {Ax} \sim \mathcal{CN}(\boldsymbol y; \boldsymbol{Ax}, \boldsymbol \Sigma_2)$ ，则关于 $\boldsymbol x$ 的后验分布：
$\begin{aligned} p(\boldsymbol x| \boldsymbol y) &\propto \mathcal {CN}(\boldsymbol x; \boldsymbol r, \boldsymbol \Sigma_1) \cdot \mathcal{CN}(\boldsymbol y; \boldsymbol{Ax}, \boldsymbol \Sigma_2) \\ & \propto \exp{\left \{ -{(\boldsymbol x - \boldsymbol r)^H \boldsymbol \Sigma^{-1}_1 (\boldsymbol x - \boldsymbol r)}{} -{(\boldsymbol {Ax} - \boldsymbol y)^H \boldsymbol \Sigma^{-1}_2 (\boldsymbol {Ax} - \boldsymbol y)}{} \right \}} \\ & \propto \exp{\left \{ {\boldsymbol x^H \boldsymbol \Sigma^{-1}_1 \boldsymbol x - 2 \mathcal{R} \left \{\boldsymbol r^H \boldsymbol \Sigma^{-1}_1 \boldsymbol x\right \}}{} - {\boldsymbol x^H \boldsymbol A^H \boldsymbol \Sigma^{-1}_2 \boldsymbol A \boldsymbol x - 2 \mathcal{R} \left \{\boldsymbol y^H \boldsymbol \Sigma^{-1}_2 \boldsymbol A \boldsymbol x\right \}}{} \right \}} \\ &= \exp{\left \{ {\boldsymbol x^H \left ( \boldsymbol \Sigma^{-1}_1 + \boldsymbol A^H \boldsymbol \Sigma^{-1}_2 \boldsymbol A \right ) \boldsymbol x - 2 \mathcal{R} \left \{ \left( \boldsymbol r^H \boldsymbol \Sigma^{-1}_1 + \boldsymbol y^H \boldsymbol \Sigma^{-1}_2 \boldsymbol A \right ) \boldsymbol x \right \}}{} \right \}} \\ & = \exp \left \{ -\boldsymbol x^H \left [ \mathop {\underbrace{{\boldsymbol{\varSigma }_{1}^{-1}+{\boldsymbol A^H \boldsymbol \Sigma^{-1}_2 \boldsymbol A}^{}}{}}} \limits_{=\boldsymbol{\varSigma }_{x}^{-1}} \right ] \boldsymbol x + 2 \mathcal{ R } \left \{ \left[ \mathop {\underbrace{{\boldsymbol{\varSigma }_x\left( \boldsymbol{\varSigma }_{1}^{-1}\boldsymbol r+\boldsymbol A^H \boldsymbol{\varSigma }_{2}^{-1}\boldsymbol{y } \right)}{}}} \limits_{=\boldsymbol{\mu }_x} \right] ^H \boldsymbol \Sigma^{-1}_x \boldsymbol x \right \} \right \} \\ \end{aligned}$

所以有
$\begin{aligned} \boldsymbol \Sigma_x &= {\left ( \boldsymbol{\varSigma }_{1}^{-1}+\boldsymbol A^H \boldsymbol \Sigma^{-1}_2 \boldsymbol A ^{} \right )}^{-1} \\ \boldsymbol x &={\left ( \boldsymbol{\varSigma }_{1}^{-1}+\boldsymbol A^H \boldsymbol \Sigma^{-1}_2 \boldsymbol A ^{} \right )}^{-1} \left( \boldsymbol{\varSigma }_{1}^{-1}\boldsymbol r+\boldsymbol A^H \boldsymbol{\varSigma }_{2}^{-1}\boldsymbol{y } \right) \end{aligned}$
事实上， $\boldsymbol x = \mathbb E[\boldsymbol x| \boldsymbol y]$ ，所以该均值也是MMSE估计的结果，因为其估计结果是线性的，所以也称为“LMMSE”。