【转】如何推导MMSE检测公式?
这两天用到MMSE检测,对于它的推导,我前期只是在“知其然”,今天就来“知其所以然”,来证明一下MMSE检测公式。
MMSE检测用来求解什么?
首先,要知道信道的基本模型:
y
=
Hx
+
n
\textbf{y}=\textbf{H}\textbf{x}+\textbf{n}
y=Hx+n
H
\textbf{H}
H是信道矩阵,
x
\textbf{x}
x是发送信号向量,
n
\textbf{n}
n是噪声向量。
目标是用MMSE(最小化均方误差)的方法,求得使得
x
^
\hat\textbf{x}
x^最为准确的
W
\textbf{W}
W:
x
^
=
Wy
\hat\textbf{x}=\textbf{W}\textbf{y}
x^=Wy
证明
令估计信号误差为:
e
=
x
^
−
x
\textbf{e}=\hat\textbf{x}-\textbf{x}
e=x^−x
则有MSE(均方误差)为:
e
M
S
E
=
E
∣
∣
x
^
−
x
∣
∣
2
\textbf{e}_{MSE}=E||\hat\textbf{x}-\textbf{x}||^2
eMSE=E∣∣x^−x∣∣2
W
M
M
S
E
=
arg
max
W
E
∣
∣
Wy
−
x
∣
∣
2
\textbf{W}_{MMSE}=\arg \max_{\textbf{W}} E||\textbf{W}\textbf{y}-\textbf{x}||^2
WMMSE=argWmaxE∣∣Wy−x∣∣2
作出如下重写:
e
M
S
E
=
E
∣
∣
x
^
−
x
∣
∣
2
=
E
{
t
r
[
(
Wy
−
x
)
(
Wy
−
x
)
H
]
}
\textbf{e}_{MSE}=E||\hat\textbf{x}-\textbf{x}||^2=E\{tr[(\textbf{W}\textbf{y}-\textbf{x})(\textbf{W}\textbf{y}-\textbf{x})^H]\}
eMSE=E∣∣x^−x∣∣2=E{tr[(Wy−x)(Wy−x)H]}
e
M
S
E
=
E
{
t
r
(
Wy
y
H
W
H
−
Wy
x
H
−
x
y
H
W
H
+
x
x
H
)
}
\textbf{e}_{MSE}=E\{tr(\textbf{W}\textbf{y}\textbf{y}^H\textbf{W}^H-\textbf{W}\textbf{y}\textbf{x}^H-\textbf{x}\textbf{y}^H\textbf{W}^H+\textbf{x}\textbf{x}^H)\}
eMSE=E{tr(WyyHWH−WyxH−xyHWH+xxH)}
e
M
S
E
=
t
r
(
W
R
y
H
H
−
WH
R
x
−
R
x
H
H
W
H
+
R
x
)
\textbf{e}_{MSE}=tr(\textbf{W}\textbf{R}_y\textbf{H}^H-\textbf{W}\textbf{H}\textbf{R}_x-\textbf{R}_x\textbf{H}^H\textbf{W}^H+\textbf{R}_x)
eMSE=tr(WRyHH−WHRx−RxHHWH+Rx)
我们现在令
e
M
S
E
\textbf{e}_{MSE}
eMSE对
W
\textbf{W}
W的偏导为
0
\textbf{0}
0,也即:
W
∗
R
y
T
−
(
H
R
x
)
T
=
0
\textbf{W}^*\textbf{R}_y^T-(\textbf{H}\textbf{R}_x)^T=\textbf{0}
W∗RyT−(HRx)T=0
同时取复共轭:
W
R
y
H
=
(
H
R
x
)
H
\textbf{W}\textbf{R}_y^H=(\textbf{H}\textbf{R}_x)^H
WRyH=(HRx)H
R
\textbf{R}
R均为Hermitian矩阵,所以矩阵本身等于它的复共轭矩阵:
W
R
y
=
R
x
H
H
\textbf{W}\textbf{R}_y=\textbf{R}_x\textbf{H}^H
WRy=RxHH
得到:
W
=
R
x
H
H
R
y
−
1
\textbf{W}=\textbf{R}_x\textbf{H}^H\textbf{R}_y^{-1}
W=RxHHRy−1
又因为:
R
y
=
E
[
y
y
H
]
=
H
R
x
H
H
+
R
n
\textbf{R}_y=E[\textbf{y}\textbf{y}^H]=\textbf{H}\textbf{R}_x\textbf{H}^H+\textbf{R}_n
Ry=E[yyH]=HRxHH+Rn和
R
x
=
E
[
x
x
H
]
=
I
R
n
=
E
[
n
n
H
]
=
σ
2
I
\textbf{R}_x=E[\textbf{x}\textbf{x}^H]=\textbf{I}\\ \textbf{R}_n=E[\textbf{n}\textbf{n}^H]=\sigma^2\textbf{I}
Rx=E[xxH]=IRn=E[nnH]=σ2I
那么有:
W
=
H
H
(
H
H
H
+
σ
2
I
)
−
1
\textbf{W}=\textbf{H}^H(\textbf{H}\textbf{H}^H+\sigma^2\textbf{I})^{-1}
W=HH(HHH+σ2I)−1