信号与估计

最新推荐文章于 2023-05-27 00:58:21 发布

那年柒月人未眠

最新推荐文章于 2023-05-27 00:58:21 发布

阅读量509

点赞数 3

分类专栏：信号与统计

本文链接：https://blog.csdn.net/U201410691/article/details/90758305

版权

信号与统计专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文介绍了Cramer-Rao Lower Bound（CRLB）及其在评估无偏估计器性能中的作用，详细推导了CRLB的数学原理，并通过最大似然估计和线性最小均方误差估计展示了如何应用于实际问题，特别是在信号处理中的最优线性估计器设计。

摘要由CSDN通过智能技术生成

信号估计

CRLB的推导

1. 估计量的衡量标准

对于参数估计问题，目前存在着很多估计算法。那么如何去衡量一个估计器（estimator, 也称估计量或估计算法）的性能，我们主要考量以下三个方面

1.无偏性(unbiased)。对于参数估计问题，设未知参数θ，估计器模型 $\hatθ$ 。则有 $E[\hatθ]=θ$ 。对于估计对象为随机变量，则有 $E[\hatθ]=E[θ]$ 。我们称满足这个条件的估计量为无偏估计量。
2.有效性(availability)。有效性刻画估计量到真实值的偏离程度， $D(\hatθ)=E[(\hatθ−E[θ])2]$ ，即若存在多种无偏估计器，我们称估计量方差最小的估计器是有效的。
3.一致性(consistency)。设 $\hatθ$ 为未知参数θ的估计量，若当样本数 $N \to \infty$ 时，对于任意ϵ>0，有 $lim_{N→∞}P{|\hatθ−θ|<ϵ}=1$ 。我们称θ^与θ是一致的。一致性所体现的是，当样本总数逐渐增加时，估计量逐渐收敛于真实值。

基于这三点考量，那么很自然我们会问，如何衡量一个无偏估计器是否是有效的。统计信号处理理论中的克拉美罗下界（Cramer-Rao Lower Bound，CRLB）就是衡量一个无偏估计器的有力工具。

2. 克拉美-罗下界（Scale Parameter 标量参数）

两个正则化条件

边界依赖两个关于f(x;θ)和T(X)的弱正则化条件：Fisher信息矩阵总是存在。等价地说，对于所有x，如果 $f (x; θ) > 0$ ，则 $\partial l n f (x; θ) / \partial θ$ 存在并且有限。对x的积分和对θ的微分可以交换顺序。也就是说，在下式右侧有限时，有
$\frac{∂}{∂θ}[∫T(x)f(x;θ)dx]=∫T(x)[\frac{∂}{∂θ}f(x;θ)]dx$
上述条件通常可以通过以下任意一个条件来确认：函数f(x;θ)在x中有边界支持，并且边界不依赖于θ。函数f(x;θ)有有限的支持，连续可微，并且对于所有θ积分收敛。

其中数学期望对 $p (x; θ)$ 取。那么无偏估计量 $\hat θ$ 的方差必然满足
$D(\hat{\theta}) \geq \frac{1}{-\mathbb{E}\left[{ \frac{\partial ^2\ln p(\boldsymbol{x};\theta)}{\partial \theta^2}}\right]}=\frac{1}{\mathbb{E}\left[{ \left(\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}\right)^2}\right]}$
其中导数是在θ的真实值处求，数学期望是对 $p (x; θ)$ 取。因此，我们可以说一个无偏估计量 $g (x)$ 达到CRLB，当且仅当，该估计量满足
$\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta} =\mathbf{I}(\theta)(g(\boldsymbol{x})-\theta)$
其中
$\mathbf{I}(\theta)=-\mathbb{E}\left[{ \frac{\partial ^2\ln p(\boldsymbol{x};\theta)}{\partial \theta^2}}\right]$
称为Fisher information。

3. 克拉美罗下界推导证明

由于θ是无偏估计，即

$\int_{\boldsymbol{x}} (\hat{\theta}-\theta)p(\boldsymbol{x};\theta)\text{d}\boldsymbol{x}=0\\$
等式两边对θ求偏导有
$\int (\hat{\theta}-\theta)\frac{\partial p(\boldsymbol{x};\theta)}{\partial \theta}\text{d}\boldsymbol{x}=1\\ \Rightarrow \int (\hat{\theta}-\theta)\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}p(\boldsymbol{x};\theta)\text{d}\boldsymbol{x}=1\\ \Rightarrow \int (\hat{\theta}-\theta)\sqrt{p(\boldsymbol{x};\theta)}\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}\sqrt{p(\boldsymbol{x};\theta)}\text{d}\boldsymbol{x}=1$
根据柯西-施瓦茨不等式（Cauchy-Schwarz inequality），有
$\left({ \int (\hat{\theta}-\theta)^2{p(\boldsymbol{x};\theta)}\text{d}\boldsymbol{x}}\right) \left({\int \left(\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}\right)^2p(\boldsymbol{x};\theta)\text{d}\boldsymbol{x}}\right)\geq 1\\ \Rightarrow \int (\hat{\theta}-\theta)^2{p(\boldsymbol{x};\theta)}\text{d}\boldsymbol{x}\geq \frac{1}{\left({\int \left(\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}\right)^2p(\boldsymbol{x};\theta)\text{d}\boldsymbol{x}}\right)}$
由正则条件,可知 $\mathbb{E}\left[{\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}}\right]=0$ ,对其求导有：
$\frac{\partial }{\partial \theta} \int \frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta} p(\boldsymbol{x};\theta)\text{d}\boldsymbol{x}=0\\ \Rightarrow \int \left[{\frac{\partial^2 \ln p(\boldsymbol{x};\theta)}{\partial \theta^2}p(\boldsymbol{x};\theta)+\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}\frac{\partial p(\boldsymbol{x};\theta)}{\partial \theta}}\right]\text{d}\boldsymbol{x}=0\\ \Rightarrow \int \frac{\partial^2 \ln p(\boldsymbol{x};\theta)}{\partial \theta^2}p(\boldsymbol{x};\theta)\text{d}\boldsymbol{x}=-\int \left({\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}}\right)^2p(\boldsymbol{x};\theta)\text{d}\boldsymbol{x}$
所以有如下的结论：
$D(\hat{\theta})\geq \frac{1}{\mathbb{E}\left[{\left(\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}\right)^2}\right]}$
柯西-施瓦茨不等式在积分条件下成立的前提是

$(\hat{\theta}-\theta)^2{p(\boldsymbol{x};\theta)} = \left({\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}}\right)^2p(\boldsymbol{x};\theta)K(\theta)$
由于在CRLB边界处
$\left({ \int (\hat{\theta}-\theta)^2{p(\boldsymbol{x};\theta)}\text{d}\boldsymbol{x}}\right) \left({\int \left(\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}\right)^2p(\boldsymbol{x};\theta)\text{d}\boldsymbol{x}}\right) = 1\\$
对14式进行积分我们可以得到
$\int (\hat{\theta}-\theta)^2{p(\boldsymbol{x};\theta)}dx =\int \left({\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}}\right)^2p(\boldsymbol{x};\theta)K(\theta)dx\\ \int (\hat{\theta}-\theta)^2{p(\boldsymbol{x};\theta)}dx =K(\theta)\int \left({\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}}\right)^2p(\boldsymbol{x};\theta)dx\\ K(\theta) = (\frac{1}{\int \left({\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}}\right)^2p(\boldsymbol{x};\theta)dx})^2 \qquad \qquad$
对比2式与18式我们证明
$\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta} =-\mathbb{E}\left[{ \frac{\partial ^2\ln p(\boldsymbol{x};\theta)}{\partial \theta^2}}\right](g(\boldsymbol{x})-\theta)$

设计最优线性估计器

最优估计器的设计准则
1.选择滤波器的结构
2.选择损失函数
3.根据损失函数求解参数
4.对求解的结果进行判断，看是否满足需求

对于线性高斯模型，其模型可以写为

$\boldsymbol{x}=\boldsymbol{h}\theta+\boldsymbol{w}, \quad \boldsymbol{w}\sim \mathcal{N}(\boldsymbol{w|a},\boldsymbol{C}_{\boldsymbol{w}})$
其中 $θ$ 是未知参数， $x∈R_p$ 是观测值， $w$ 是均值为0，协方差矩阵为 $C_w$ 的高斯噪声。
对于该模型，其似然函数 $p (x; θ)$ 为：
$p(\boldsymbol{x};\theta)=\frac{1}{(2\pi)^{p/2}|\boldsymbol{C}_{\boldsymbol{w}}|^{1/2}} \exp \left[{-\frac{1}{2}(\boldsymbol{x}-\boldsymbol{h}\theta)^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}(\boldsymbol{x}-\boldsymbol{h}\theta)}\right]$
采用极大释然估计或者线性最小均方误差估计下面给出最大似然估计的推导过程
等式两边取对数，有
$ℓ(\theta)=lnL(\theta)=−\frac{1}{2}(x−h\theta)^TC_w^{-1}(x−h\theta)+C$
计算对数似然函数关于x的偏导数，有
$\frac{∂x}{∂ℓ(x)}=−\frac{1}{2}(2h^TC_w^{-1}x−2h^TC_w^{-1}H\theta)=0 \\ ⇒\theta^{ML}=(h^TC_w^{-1}h)h^TC_w^{-1}\boldsymbol{x} \qquad$
1.无偏性
$\mathbb{E}[\hat{\theta}]=\int_{\boldsymbol{x}} \hat{\theta} p(\boldsymbol{x};\theta)\text{d}\boldsymbol{x} =(\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h})^{-1}\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h}\theta=\theta$

2.有效性
$\frac{\partial \ln p(\boldsymbol{x};\theta)}{\partial \theta}=(\boldsymbol{x}-\boldsymbol{h}\theta)^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h}\\ \frac{\partial^2 \ln p(\boldsymbol{x};\theta)}{\partial \theta^2}=-\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h}$
基于上述表述，该系统模型的CRLB为
$-\frac{1}{-\mathbb{E}\left[{ \frac{\partial ^2\ln p(\boldsymbol{x};\theta)}{\partial \theta^2}}\right]}=\frac{1}{\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h}}$
而估计器 $\hat \theta$ 的方差为
$D(\hat{\theta})=\left({(\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h})^{-1}\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}}\right) \boldsymbol{C}_{\boldsymbol{w}} \left({(\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h})^{-1}\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}}\right)^T \\ =(\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h})^{-1} \qquad \qquad\qquad\qquad$
由于 $(\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h})^{-1}=\frac{1}{\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h}}$ ,因此，该估计量是有效的，即该无偏估计量θ的方差可以达到CRLB。
3.一致性
将系统模型x=hθ+w代入估计器中，有
$\hat{\theta} =(\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h})^{-1}\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}(\boldsymbol{h}\theta+\boldsymbol{w})\\ =\theta+(\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h})^{-1}\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{w}$
若假设噪声能量一定，即 $C_w$ 元素值固定，随着观测样本 $p \to \infty$ ，则噪声的方差
$D((\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{h})^{-1}\boldsymbol{h}^T\boldsymbol{C}_{\boldsymbol{w}}^{-1}\boldsymbol{w})=\frac{1}{\boldsymbol{h}^T\boldsymbol{c}_{\boldsymbol{w}}^{-1}\boldsymbol{h}}$
从公式可以看出，假设噪声 $w$ 的每个元素具有相同的方差，则必然 $lim_{p→∞}h^TC_w^{-1}h→∞$ 。因此，当 $p \to \infty$ 时,因此，对于任意 $ϵ > 0$ ，有
$\lim\limits_{N\rightarrow \infty} P \left\{{|\hat{\theta}-\theta|<\epsilon}\right\}=1$
即，该估计量满足一致性。
综上所述：得到的估计器为： $\theta=(h^TC_w^{-1}h)h^TC_w^{-1}\boldsymbol{x} \qquad$

用最大似然估计或最小二乘估计解决实际问题

如cs229第一章房价预测数据集，通过某些已知因素去拟合房价，运用最小二乘法求解

那么损失函数写为如下，
$J{(\theta)}=\frac{1}{2}\sum_{i=1}^m(h_\theta{(x^{(i)})}-y^{(i)})^2$
其中 $h_\theta{(x)}=\sum_{i=0}^n \theta_ix_i=\theta^Tx$
将其写为矩阵形式有
$X^T\theta-\vec{y}=\left[ \begin{matrix}(x^{(1)})^T\theta\\\vdots\\(x^{(m)})^T\theta\end{matrix}\right]-\left[ \begin{matrix}y^{(1)}\\\vdots\\y^{(m)}\end{matrix}\right]\\ = \left[ \begin{matrix}(x^{(1)})^T\theta-y^{(1)}\\\vdots\\(x^{(m)})^T\theta-y^{(m)}\end{matrix}\right]$
那么 $J(\theta)$ 可以写为如下的矩阵形式：
$\frac{1}{2}(X\theta-\vec{y})^T(X\theta-\vec{y})=\frac{1}{2}\sum_{i=1}^m(h_\theta{(x^{(i)})}-y^{(i)})^2=J{(\theta)}$
其形式与第二步相似，我们可以得出如下解的形式：
$X^TX\theta=X^T\vec y\Longrightarrow\theta=(X^TX)^{-1}X^T\vec y\tag{39}$

那年柒月人未眠

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
信号与估计

信号估计CRLB的推导设计最优线性估计器用最大似然估计或最小二乘估计解决实际问题CRLB的推导1. 估计量的衡量标准对于参数估计问题，目前存在着很多估计算法。那么如何去衡量一个估计器（estimator, 也称估计量或估计算法）的性能，我们主要考量以下三个方面1.无偏性(unbiased)。对于参数估计问题，设未知参数θ，估计器模型θ^\hatθθ^。则有E[θ^]=θE[\hatθ...
复制链接

扫一扫

专栏目录