信息矩阵、hessian矩阵与协方差矩阵

Nie_Xun

已于 2024-02-24 18:15:07 修改

阅读量1.9k

点赞数 22

文章标签：矩阵线性代数机器学习

于 2024-02-23 11:28:04 首次发布

本文链接：https://blog.csdn.net/weixin_41469272/article/details/136250678

版权

文章目录

本节探讨信息矩阵、hessian矩阵与协方差矩阵的关系，阐明边缘化的原理。
一个简单的示例，如下：
来自 David Mackay. “The humble Gaussian distribution”. In: (2006). 以及手写vio第四节。
在这里插入图片描述

箭头代表了约束方程(或可以理解为观测方程)：

\begin{array}{} { {z_1}:}\\ { {z_2}:}\\ { {z_3}:} \end{array}\begin{array}{} { {x_2} = {v_2}}\\ {\,{x_1} = {w_1}{x_2} + {v_1}}\\ {\,{x_3} = {w_3}{x_2} + {v_3}} \end{array}

其中， $v_i$ 相互独立，且各自服从零均值，协方差为 $\sigma_i^2$ 的高斯分布。

协方差矩阵

协方差计算公式：
$\begin{aligned} Cov(X,Y) &= E[(X - E[X]) * (Y - E[Y])\\ &= E[XY] - 2E[X]E[Y] + E[X]E[Y]\\ &= E[XY] - E[X]E[Y] \end{aligned}$

或： ${\mu _x})(Y - {\mu _y})]$

计算 $x_1,x_2,x_3$ 之间的协方差矩阵：
$\begin{aligned} { {\rm{\Sigma }}_{11}} &= E({x_1}{x_1}) = E(({w_1}{v_2} + {v_1})({w_1}{v_2} + {v_1}))\\ &= w_1^2E(v_2^2) + 2{w_1}E({v_1}{v_2}) + E(v_1^2)\\ &= w_1^2\sigma _2^2 + \sigma _1^2\\ { {\rm{\Sigma }}_{22}} &= \sigma _2^2,\quad { {\rm{\Sigma }}_{33}} = w_3^2\sigma _2^2 + \sigma _3^2\\ { {\rm{\Sigma }}_{12}} &= E({x_1}{x_2}) = E(({w_1}{v_2} + {v_1}){v_2}) = {w_1}\sigma _2^2\\ { {\rm{\Sigma }}_{13}} &= E(({w_1}{v_2} + {v_1})({w_3}{v_2} + {v_3})) = {w_1}{w_3}\sigma _2^2 \end{aligned}$

最后得到协方差矩阵：
$\Sigma = \left[ {\begin{array}{} {w_1^2\sigma _2^2 + \sigma _1^2}&{ {w_1}\sigma _2^2}&{ {w_1}{w_3}\sigma _2^2}\\ { {w_1}\sigma _2^2}&{\sigma _2^2}&{ {w_3}\sigma _2^2}\\ { {w_1}{w_3}\sigma _2^2}&{ {w_3}\sigma _2^2}&{w_3^2\sigma _2^2 + \sigma _3^2} \end{array}} \right]$

最低0.47元/天解锁文章