已知高维高斯联合概率分布求边缘概率分布以及条件概率分布

最新推荐文章于 2024-05-15 12:44:45 发布

鼻始拌饭加个蛋

最新推荐文章于 2024-05-15 12:44:45 发布

阅读量2.3k

点赞数 3

分类专栏：机器学习文章标签：统计学算法线性代数

本文链接：https://blog.csdn.net/StoneColdSteve/article/details/116210556

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

博主最近在看卡尔曼滤波算法，个人认为在卡尔曼滤波算法中最核心的部分莫过于高维高斯联合概率分布的性质，因此打算将这些性质整理成博客记录下来方便自己今后的学习，如果有哪里不对，欢迎各位读者指正。

一引理

这里我引入一个定理，这个定理不在本博客证明，因为它很直观，便于理解。
假设随机变量 $X$ 服从均值为 $\mu$ ，协方差矩阵为 $\Sigma$ 的高斯分布(为了更具有一般性，这里的均值是一个向量，协方差是一个矩阵)。随机变量 $Y = A X + B$ (这里的矩阵 $A$ 和 $B$ 都是常值矩阵)，则结论是 $Y$ 也服从于一个高维高斯分布，它的均值是 $A\mu+B$ ，协方差矩阵是 $A\Sigma{A^{T}}$ 。

二推导

设 $p$ 维随机变量 $X=(x_1,x_2,\dots,x_p)^{T}$ 服从均值 $\mu=(\mu_1,\mu_2,\dots,\mu_p)^{T}$ ，协方差矩阵为式(2-1)的高斯分布，现在我们将随机变量 $X$ 切分为两个随机变量，第一个随机变量取随机变量 $X$ 的前 $m$ 维记为 $X_a$ ，对应的均值为 $\mu_a$ 。第二个随机变量取随机变量 $X$ 的后 $n$ 维记为 $X_b$ ，对应的均值为 $\mu_b$ ，且满足( $m + n = p$ )。则随机变量 $X$ 可以写成 $X=(X_a,X_b)^{T}$ ，均值可以写成 $\mu=(\mu_a,\mu_b)^{T}$ ，协方差矩阵可写成式(2-2)。
$\Sigma= \left\{ \begin{matrix} \sigma_{11} & \sigma_{12} & \dots & \sigma_{1p} \\ \sigma_{21} & \sigma_{22} & \dots & \sigma_{2p} \\ \vdots & \vdots & \dots & \sigma_{3p} \\ \sigma_{p1} & \sigma_{p2} & \dots & \sigma_{pp} \end{matrix} \right\} \tag{2-1}$

$\Sigma= \left\{ \begin{matrix} \Sigma_{aa}&\Sigma_{ab}\\ \Sigma_{ba}&\Sigma_{bb} \end{matrix} \right\} \tag{2-2}$

现在的问题是随机变量 $X_a$ 以及在给定 $X_a$ 的条件下 $X_b$ 服从什么样参数的分布?
为了使用引入的定理，这里我们构造出 $X_a$ 与 $X$ 之间的关系，即 $X_a=(I_m,0_n)X$ 。由此可以看出， $X_a$ 可以由 $X$ 线性表出，则 $X_a$ 服从高斯分布，均值和协方差矩阵求解见式(2-3)。
$E[X_a]=(I_m,0)\mu=\mu_a\\ Var[X_a]= \begin{pmatrix} I_m&0 \end{pmatrix} \begin{pmatrix} \Sigma_{aa}&\Sigma_{ab}\\ \Sigma_{ba}&\Sigma_{bb} \end{pmatrix} \begin{pmatrix} I_m^{T}\\ 0\\ \end{pmatrix}= \begin{pmatrix} \Sigma_{aa}&\Sigma_{ab} \end{pmatrix} \begin{pmatrix} I_m\\ 0 \end{pmatrix} =\Sigma_{aa} \tag{2-3}$

所以 $X_a$ 服从于均值为 $\mu_a$ ，协方差为 $\Sigma_{aa}$ 的高斯分布。
现在做一下变量替换，见式(2-4)，这里的替换纯属是为了后面计算方便，读者不必纠结于此。
$X_{b.a}=X_b-\Sigma_{ba}\Sigma_{aa}^{-1}X_{a}\\ \mu_{b.a}=\mu_b-\Sigma_{ba}\Sigma_{aa}^{-1}\mu_a\\ \Sigma_{bb.a}=\Sigma_{ba}-\Sigma_{aa}^{-1}\Sigma_{ab} \tag{2-4}$
于是 $X_{b.a}$ 可以表示为 $(-\Sigma_{ba}\Sigma_{aa}^{-1},I_n)X$ 。并且可以验证， $X_{b.a}$ 的期望为 $\mu_{b.a}$ ，协方差为 $\Sigma_{bb.a}$ 。因此 $X_b=X_{b.a}+\Sigma_{ba}\Sigma_{aa}^{-1}X_a$ 。所以在给定 $X_a$ 的前提下， $E[X_{b}|X_a]=\mu_{b.a}+\Sigma_{ba}\Sigma_{aa}^{-1}\mu_a$ ， $Var[X_b|X_a]=Var[X_{b.a}]=\Sigma_{bb.a}$ 。

鼻始拌饭加个蛋

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
已知高维高斯联合概率分布求边缘概率分布以及条件概率分布

博主最近在看卡尔曼滤波算法，个人认为在卡尔曼滤波算法中最核心的部分莫过于高维高斯联合概率分布的性质，因此打算将这些性质整理成博客记录下来方便自己今后的学习，如果有哪里不对，欢迎各位读者指正。一引理这里我引入一个定理，这个定理不在本博客证明，因为它很直观，便于理解。假设随机变量XXX服从均值为μ\muμ，协方差矩阵为Σ\SigmaΣ的高斯分布(为了更具有一般性，这里的均值是一个向量，协方差是一个矩阵)。随机变量Y=AX+BY=AX+BY=AX+B(这里的矩阵AAA和BBB都是常值矩阵)
复制链接

扫一扫