线性最小方差估计和射影定理

weixin_42276688

于 2023-03-14 21:40:22 发布

阅读量615

点赞数 2

文章标签：概率论机器学习算法

本文链接：https://blog.csdn.net/weixin_42276688/article/details/129521086

版权

线性最小方差估计和射影定理

主要参考了邓自立老师的《信息融合滤波理论及其应用》，邓老师另外还有一本《卡尔曼滤波与维纳滤波》，后者该部分的推导过程基本是前者的简化版，黄小平老师的《卡尔曼滤波原理及应用》则推导更加简便（看不懂，省略过多），建议初学者阅读《信息融合滤波理论及其应用》。

一、线性最小方差估计

1、得到线性最小方差估计

随机变量 $y$ 属于空间 $R^m$ ，维度为 $[m, 1]$ ；随机变量 $x$ 属于空间 $R^n$ ，维度为 $[n, 1]$ 。存在一个线性函数可以从 $y$ 估计 $x$ ，估计值写作 $\widehat{x}$ ，该线性函数写作：
$\widehat{x}=b+A \times y$

此时的方差 $J=E[(x-\hat x)^T \times (x-\hat x)]=E[(x-b-A \times y)^T \times (x-b-A \times y)]$

想要得到合适的参数 $b$ 和 $A$ ，使得 $J$ 最小化，不妨令 $\frac{\partial J}{\partial b}=-2E(x-b-Ay)=0$

可以解得 $\begin{cases} b=Ex-A\times Ey\\ A=P_{xy}{P_{yy}}^{-1}\\ \end{cases}$

由此可得 $\hat{x}=Ex+P_{xy}{P_{yy}}^{-1}\left( y-Ey \right)$

2、一些特性

（1）无偏性： $E\hat x=Ex$

$\hat x=E[Ex+P_{xy}P_{yy}^{-1}(y-Ey)]\\ =Ex+P_{xy}P_{yy}^{-1}(Ey-Ey)\\ =Ex$

（2）正交性： $E[(x-\hat x)y^T]=0$

首先：
$E[(x-Ex-P_{xy}P_{yy}^{-1}(Ey-Ey)){Ey}^T]展开后\\ =E(xE^{T}(y))-E[E(x)E^T(y)]-P_{xy}P_{yy}^{-1}E(y)E^T(y)+P_{xy}P_{yy}^{-1}E(y)E^T(y)\\ =0$

然后：
$E[(x-\hat x)y^T]\\ =E[(x-Ex-P_{xy}P_{yy}^{-1}(Ey-Ey))y^T]\\ =E[(x-Ex-P_{xy}P_{yy}^{-1}(Ey-Ey))(y-Ey)^T] (由上式子推出)\\ =E[(x-Ex)(y-Ey)^T]-E[P_{xy}P_{yy}^{-1}(y-Ey)(y-Ey)^T]\\ =P_{xy}-P_{xy}P_{yy}P_{yy}^{-1}\\ =0$

（3）不相关性： $\bar x = x- \hat x$ 与 $y$ 不相关

$\hat x]=E(x)-E(\hat x)=0$

$E[[(x-\hat x)-E(x-\hat x)](y-Ey)^T]\\ =E[(x-\hat x)(y-Ey)^T]\\ =E[(x-\hat x)y^T]-E[(x- \hat x)(Ey)^T]\\ =0$

二、射影定理

摄影定理是高维空间中的正交分解。线性流形就是高维向量组成的集合。

由前文知道 $x-\hat x$ 和 $y$ 不相关且正交，不妨称这种情况为 $x-\hat x$ 垂直 $y$ ，记作 $(x-\hat x) \bot y$ ,并称作 $\hat x$ 为 $x$ 在 $y$ 上的射影，写作 $\hat x=proj(x|y)$ 。

1、随机变量的线性最小方差估计就是射影的结果。

随机变量 $y(1),\cdots,y(k)\in R^m$ 对随机变量 $\in R^n$ 的线性最小方差估计 $\hat x$

$\hat x=proj(x|w)\triangleq proj(x|y(1),\cdots,y(k))$
称 $\hat x$ 为 $x$ 在线性流形 $L (w)$ 或 $L(y(1),\cdots,y(k))$ 上的射影。

$L (w)$ 定义为:
$L(w)\triangleq L(y(1),\cdots,y(k))\\ =\{y|y=Aw+b,\forall b\in R^n,\forall A\in R^{n \times km}\}$

2、一个推论

若 $\in R^n$ 为0均值随机向量， $\cdots ,y(k) \in R^m$ 为0均值互不相关（正交）的随机变量，那么存在以下性质：
$proj(x|y(1),\cdots ,y(k))=\sum_{i=1}^k{proj\left( x|y\left( i \right) \right)}$
证明：
$proj(x|y(1),\cdots,y(k))=proj(x|w)=P_{xw}P_{ww}^{-1}w=\\ E\left[ x\left( y^T\left( 1 \right) ,\cdots ,y^T\left( k \right) \right) \right] \left[ \begin{matrix} P_{y\left( 1 \right) y\left( 1 \right)}^{-1}& 0& \cdots& 0\\ 0& \ddots& 0& \vdots\\ \vdots& 0& \ddots& 0\\ 0& \cdots& 0& P_{y\left( k \right) y\left( k \right)}^{-1}\\ \end{matrix} \right] \left[ \begin{array}{c} y\left( 1 \right)\\ \vdots\\ y\left( k \right)\\ \end{array} \right] =\\ \sum_{i=1}^k{P_{xy\left( i \right)}P_{y\left( i \right) y\left( i \right)}^{-1}y\left( i \right) =\sum_{i=1}^k{proj\left( x|y\left( i \right) \right)}}$