线性高斯模型的估计方法

最新推荐文章于 2023-12-27 18:07:49 发布

「已注销」

最新推荐文章于 2023-12-27 18:07:49 发布

阅读量5.4k

点赞数 9

分类专栏：信号处理文章标签：线性高斯模型最小均方误差估计最小二乘法最大似然估计最大后验概率估计

本文链接：https://blog.csdn.net/u012284960/article/details/89294321

版权

本文详细介绍了线性高斯模型的几种估计方法，包括最小二乘法（LS）、最大似然估计（ML）、最小均方误差估计（MMSE）和最大后验概率估计（MAP）。在这些方法中，最小二乘法和最大似然估计在特定条件下得到相同的解。最小均方误差估计考虑了噪声的影响，是贝叶斯最优的，而最大后验概率估计则是寻找后验概率最大的估计值。文章还讨论了线性最小均方误差估计（LMMSE）及其简化形式，并指出在某些情况下，LMMSE和MAP估计是相同的。

摘要由CSDN通过智能技术生成

个人博客：www.qiuyun-blog.cn

系统模型

对于线性高斯模型
$\boldsymbol{y}=\boldsymbol{Hx}+\boldsymbol{w}$ 其中 $\boldsymbol{x}\in \mathbb{R}^N$ 为待估计变量，其概率密度为 $p(\boldsymbol{x})$ 。 $\boldsymbol{w}$ 是高斯白噪声，即 $\boldsymbol{w}\sim \mathcal{N}(\boldsymbol{w}|\boldsymbol{a},\boldsymbol{C}_{\boldsymbol{w} })$ 。信号估计的目标是根据已知的模型信息，从观测向量 $\boldsymbol{y}\in \mathbb{R}^M$ 中恢复出原始信号 $\boldsymbol{x}$ 。为了得到确定解，一般 $\boldsymbol{y}$ 的维度大于 $\boldsymbol{x}$ 的维度，即模型为超定方程组。

最小二乘法（Least Square, LS）

$\boldsymbol{x}$ 的最小二乘估计，通过最小化如下损失函数得到
$J=||\boldsymbol{y}-\boldsymbol{Hx}||^2$ 由于该损失函数是凸函数，因此我们通过计算损失函数对 $\boldsymbol{x}$ 的导数
$\frac{\partial J}{\partial \boldsymbol{x} }=-2\boldsymbol{H}^T\boldsymbol{y}+2\boldsymbol{H}^T\boldsymbol{H}\boldsymbol{x}$ 并令导数为零，得到该模型的最小二乘估计
$\hat{\boldsymbol{x} }_{\text{LS} }=(\boldsymbol{H}^T\boldsymbol{H})^{-1}\boldsymbol{H}^T\boldsymbol{y}$

几何解释: 如图所示，由于 $\boldsymbol{H}$ 所构成的超平面用 $\mathcal{C}$ 表示，最小化 $J=||\boldsymbol{y}-\boldsymbol{Hx}||^2$ 所描述的是，找到 $\boldsymbol{y}$ 在超平面 $\mathcal{C}$ 上的正交投影。

Remarks:

最小二乘的优势在于算法结构简单，其缺陷在于，由于忽略了噪声的存在，因此当噪声很大的时候，其估计性能极差。

最大似然估计（Maximum likelihood, ML）

似然函数的定义（摘自Wiki Pedia）：

In frequentist inference, a likelihood function (often simply the likelihood) is a function of the parameters of a statistical model, given specific observed data. Likelihood functions play a key role in frequentist inference, especially methods of estimating a parameter from a set of statistics. In informal contexts, “likelihood” is often used as a synonym for “probability”. In mathematical statistics, the two terms have different meanings. Probability in this mathematical context describes the plausibility of a random outcome, given a model parameter value, without reference to any observed data. Likelihood describes the plausibility of a model parameter value, given specific observed data.
在概率推论中，一个似然函数（简称似然）是给定明确的观测数据，关于一个统计模型的参数的函数。似然函数在概率推论中扮演着重要的角色，尤其是从一组统计数据中估计参数。在非正式的文献中，似然函数通常被认为是“概率”。在统计数学中，这两者有不同的含义。在数学文献中，概率描述的是给定模型参数值下一个随机输出的可能性，没有参考任何观测数据。似然函数描述的是给定具体观测数据，模型参数值得可能性。
Following Bayes’ Rule, the likelihood when seen as a conditional density can be multiplied by the prior probability density of the parameter and then normalized, to give a posterior probability density.
根据贝叶斯公式，似然函数被看作是条件概率，可以乘上先验概率然后归一化得到后验概率。

对于线性高斯模型 $\boldsymbol{y}=\boldsymbol{Hx}+\boldsymbol{w}$ ，为了方便计算，这里我们设 $\boldsymbol{w}\sim \mathcal{N}(\boldsymbol{0},\sigma^2\mathbf{I})$ ，则该模型的其似然函数为
$L(\boldsymbol{x})=p(\boldsymbol{y}|\boldsymbol{x})=\mathcal{N}(\boldsymbol{y}|\boldsymbol{Hx},\sigma^2\mathbf{I})\\ \qquad \qquad \qquad \qquad \qquad \quad \ =(2\pi\sigma^2)^{-\frac{M}{2} }\exp \left(-\frac{1}{2\sigma^2}(\boldsymbol{y}-\boldsymbol{Hx})^T(\boldsymbol{y}-\boldsymbol{Hx})\right)$ 等式两边取对数，有
$\ell(\boldsymbol{x})=\ln L(\boldsymbol{x})=-\frac{1}{2\sigma^2}(\boldsymbol{y}-\boldsymbol{Hx})^T(\boldsymbol{y}-\boldsymbol{Hx})-\frac{M}{2}\ln (2\pi\sigma^2)$ 计算对数似然函数关于 $\boldsymbol{x}$ 的偏导数，有
$\frac{\partial \ell(\boldsymbol{x})}{\partial \boldsymbol{x} }=-\frac{1}{2\sigma^2}(2\boldsymbol{H}^T\boldsymbol{y}-2\boldsymbol{H}^T\boldsymbol{H}\boldsymbol{x})=0 \ \Rightarrow \hat{\boldsymbol{x} }_{\text{ML} }=(\boldsymbol{H}^T\boldsymbol{H})^{-1}\boldsymbol{H}^T\boldsymbol{y}$ 因此，我们发现，线性高斯模型的最大似然解和最小二乘解一致。

最小均方误差估计（Minimum mean square error, MMSE）

定义如下贝叶斯均方误差（Bayesian mean square error, Bmse）
$\text{Bmse}(\hat{\boldsymbol{x} })=\mathbb{E}\left\{||\boldsymbol{x}-\hat{\boldsymbol{x} }||^2\right\}=\int ||\boldsymbol{x}-\hat{\boldsymbol{x} }||^2p(\boldsymbol{x},\boldsymbol{y})\text{d}\boldsymbol{x}\text{d}\boldsymbol{y}$ 最小均方误差估计量，即寻找使得贝叶斯均方误差最小的 $\boldsymbol{x}$