深入浅出GAMP算法（下）：MMSE估计和AWGN场景

最新推荐文章于 2024-05-06 14:21:20 发布

B417科研笔记

最新推荐文章于 2024-05-06 14:21:20 发布

阅读量4.5k

点赞数 12

分类专栏：通信中的常用数学文章标签：算法概率论机器学习

本文链接：https://blog.csdn.net/weixin_39274659/article/details/120505819

版权

通信中的常用数学专栏收录该内容

48 篇文章

订阅专栏

前言

在前两篇博客中，我们分别讲述了消息传递算法的来龙去脉和利用高斯及泰勒展开近似得到的最大后验估计的GAMP版本。这一篇博客，我们使用类似的推导，整理了在实际中可能更常用的， MMSE 最小均方误差估计版本的 GAMP 算法。

模型背景

在这里插入图片描述

我们旨在解决上图这样的问题，已知输入 $\mathbf{q}$ （先验信息），已知输出 $\mathbf{y}$ （后验信息)，已知变换矩阵 $\mathbf{A}$ ，反推出变量 $\mathbf{x}$ 。以AWGN信道举例：
$\mathbf{y}=\mathbf{z}+\mathbf{w}=\mathbf{A} \mathbf{x}+\mathbf{w}$
$\mathbf{y}$ 已知而我们试图反推出 $\mathbf{x}$ 。此时，如果 $\mathbf{x}$ 有一些先验分布信息，如稀疏分布，即 $\mathbf{x}$ 中只有少量元素非零，那么，便可以通过概率的方式，以GAMP算法进行求解。

MMSE

上一篇博客中我们写到的 MAP 版本的 GAMP 旨在给出以下的估计量：
$\widehat{\mathbf{x}}^{\text {map }}:=\underset{\mathbf{x} \in \mathbb{R}^{n}}{\arg \max } F(\mathbf{x}, \mathbf{z}, \mathbf{q}, \mathbf{y}), \quad \widehat{\mathbf{z}}=\mathbf{A} \widehat{\mathbf{x}}$
即最大化后验概率。我举一个例子，比如经过计算得到， $x = 0.5$ 的概率是 $0.2$ ，而 $x = 0.1$ 的概率是 $0.19$ ， $x = 0.11$ 的概率是 $0.18$ ， $x = 0.09$ 的概率是 $0.17$ 。此时，如果使用最大后验 MAP 估计，得到的 $x$ 估计结果就是 $x = 0.5$ 。但在这种情况下这就有失偏颇，因为他完全没有考虑其他情况的概率。这就有点像通信中的硬判决，一刀切，因此，综合了所有可能情况的软判决，可能更显客观，这也是我们要介绍的MMSE估计，即：
$\widehat{\mathrm{x}}^{\mathrm{mmse}}:=\mathbb{E}[\mathrm{x} \mid \mathrm{y}, \mathbf{q}]$
以期望作为估计值。下面，我们就推导以MMSE为估计准则的GAMP版本。

回顾下MAP中的消息传递：
在这里插入图片描述
在每次迭代中，实际要计算两个消息算子：
$\ x j f out ( z i , y i ) + ∑ r ≠ j Δ i ← r ( t , x r ) (1) \begin{aligned} {\Delta}_{i \rightarrow j}\left(t, x_{j}\right)=\mathrm{const} +\max _{\mathbf{x}\backslash x_j} f_{\text {out }}\left(z_{i}, y_{i}\right)+\sum_{r \neq j} \Delta_{i \leftarrow r}\left(t, x_{r}\right) \end{aligned}\tag{1}$
和
$\begin{aligned} {\Delta}_{i \leftarrow j}\left(t+1, x_{j}\right)=\mathrm{const} +f_{\mathrm{in}}\left(x_{j}, q_{j}\right)+\sum_{\ell \neq i} \Delta_{\ell \rightarrow j}\left(t, x_{j}\right) \end{aligned}\tag{2}$

注意到(1)式中，由于是MAP准则，因此传递的消息里也是求了 $\max$ 后的结果。然而在MMSE准则下，我们要传递的消息就变成了：
$\Delta_{i \rightarrow j}\left(t, x_{j}\right)=\log \mathbb{E}\left(p_{Y \mid Z}\left(y_{i}, z_{i}\right) \mid x_{j}\right)+\text { const }\tag{3}$
和
$\Delta_{i \leftarrow j}\left(x_{j}\right)=\text { const }+\log p_{X \mid Q}\left(x_{j} \mid q_{j}\right)+\sum_{l \neq i} \Delta_{l \rightarrow j}\left(x_{j}\right) \tag{4}$
注意到，在这个消息传递中，传递的都是似然信息了，也就是说有：
$p_{i \leftarrow r}\left(x_{r}\right) \propto \exp \Delta_{i \leftarrow r}\left(t, x_{r}\right)$
值得一提的是，在(3)中的期望是对随机变量 $z_{i}=\mathbf{a}_{i}^{T} \mathbf{x}$ 进行求取，此时 $x_j$ 是固定的，而 $\mathbf{x}$ 中的其余项，则服从独立分布 $p_{i \leftarrow r}\left(x_{r}\right) \propto \exp \Delta_{i \leftarrow r}\left(t, x_{r}\right)$ 。

和 MAP估计一样，我们最后要得到的估计值也是由下式得出：
$p_{j}\left(x_{j}\right) \propto \exp \Delta_{j}\left(t, x_{j}\right)$
其中
$\Delta_{j}\left(t+1, x_{j}\right)=f_{\mathrm{in}}\left(x_{j}, q_{j}\right)+\sum_{i} \Delta_{i \rightarrow j}\left(t, x_{j}\right)$

那么，后续我们就是通过合理的近似，对消息传递算法进行简化。
类似地，我们先定义如下变量：
我们需要定义的变量也变为：
$\begin{aligned} \widehat{x}_{j}(t) &:=\mathbb{E}\left[x_{j} \mid \Delta_{j}(t, \cdot)\right] \\ \widehat{x}_{i \leftarrow j}(t) &:=\mathbb{E}\left[x_{j} \mid \Delta_{i \leftarrow j}(t, \cdot)\right] \\ \tau_{j}^{x}(t) &:=\operatorname{var}\left[x_{j} \mid \Delta_{j}(t, \cdot)\right] \\ \tau_{i \leftarrow j}^{x}(t) &:=\operatorname{var}\left[x_{j} \mid \Delta_{i \leftarrow j}(t, \cdot)\right], \end{aligned}$
其中 $\hat{x}_j$ 就是我们最后要得到的估计量。

我们先对 (3) 进行近似，这可以写为：
$\begin{aligned} &\Delta_{i \rightarrow j}\left(t, x_{j}\right) \\ &=\text { const }+\log \int_{\left\{x_{r}\right\}_{r \neq j}} p_{Y \mid Z}(y_{i} \mid \underbrace{a_{i j} x_{j}+\sum_{r \neq j} a_{i r} x_{r}}_{\triangleq z_{i}}) \prod_{r \neq j} e^{\Delta_{i \leftarrow r}\left(t, x_{r}\right)} . \end{aligned}$
而当矩阵维度较大时，那么，根据中心极限定理，相互独立的随机变量，其和服从高斯分布，且均值就是各自均值之和，而方差则是各自方差之和，因此，有：
$z_{i} \mid x_{j} \sim \mathcal{N}\left(a_{i j} x_{j}+\widehat{p}_{i\leftarrow j}(t), \tau_{i\leftarrow j}^{p}(t)\right)$
其中，
$\begin{aligned} \widehat{p}_{i \rightarrow j}(t) &:=\sum_{r \neq j} a_{i r} \widehat{x}_{i \leftarrow r}(t) \\ \tau_{i \rightarrow j}^{p}(t) &:=\sum_{r \neq j}\left|a_{i r}\right|^{2} \tau_{r}^{x}(t) \end{aligned}$
那么，我们进一步就有：
$\Delta_{i \rightarrow j}\left(t, x_{j}\right) \approx \text { const }+\underbrace{\log \int_{z_{i}} p_{Y \mid Z}\left(y_{i} \mid z_{i}\right) \mathcal{N}\left(z_{i} ; a_{i j} x_{j}+\widehat{p}_{i\leftarrow j}(t), \tau_{i\leftarrow j}^{p}(t)\right)}_{\triangleq H\left(a_{i j} x_{j}+\widehat{p}_{i\leftarrow j}(t), y_{i}, \tau_{i\leftarrow j}^{p}(t)\right)}\tag{5}$
这里，我们有：
$H\left(\widehat{p}, y, \mu^{p}\right) \triangleq \log \int p_{Y \mid Z}(y \mid z) \mathcal{N}\left(z ; \widehat{p}, \mu^{p}\right) d z$
( $\mu^p$ 和 $\tau^p$ 是一样的）
那么类似 MAP版本的思路，接下来我们要把所有 $i\leftarrow j$ 项替换掉，定义变量：
$\widehat{p}_{i}(t):=\sum_{j} a_{i j} \widehat{x}_{i \leftarrow j}(t)=\widehat{p}_{i \rightarrow j}+a_{ij} \widehat{x}_{i \leftarrow j}(t)， \tau_{i}^{p}(t)=\sum_{j}\left|a_{i j}\right|^{2} \tau_{j}^{x}(t) + a_{ij}^2\tau_j^x(t)$
那么，(5)可以被写为
$\Delta_{i \rightarrow j}\left(t, x_{j}\right) \approx H\left(\widehat{p}_{i}(t)+a_{i j}\left(x_{j}-\widehat{x}_{j}\right), y_{i}, \tau_{i}^{p}(t)\right)+\text { const. }$
可以通过泰勒展开得到：
$\begin{aligned} \Delta_{i \rightarrow j}(&\left.t, x_{j}\right) \approx \text { const } \\ &+s_{i}(t) a_{i j}\left(x_{j}-\widehat{x}_{j}(t)\right)-\frac{\tau_{i}^{s}(t)}{2} a_{i j}^{2}\left(x_{j}-\widehat{x}_{j}(t)\right)^{2} \\ =& \operatorname{const}\left[s_{i}(t) a_{i j}+a_{i j}^{2} \tau_{i}^{s}(t) \widehat{x}_{j}(t)\right] x_{j} \\ &-\frac{\tau_{i}^{s}(t)}{2} a_{i j}^{2} x_{j}^{2} \end{aligned}\tag{6}$
这两个表达式和之前一样，这里的近似是我们忽略了 $O\left(a_{i j}^{2}\right)$ 级的项。其中，
$\begin{aligned} \widehat{s}_{i}(t) &=g_{\text {out }}\left(t, \widehat{p}_{i}(t), y_{i}, \tau_{i}^{p}(t)\right) \\ \tau_{i}^{s}(t) &=-\frac{\partial}{\partial \widehat{p}} g_{\text {out }}\left(t, \widehat{p}_{i}(t), y_{i}, \tau_{i}^{p}(t)\right) \end{aligned}$
这些都是和MAP版本的定义完全一致，然而由于 $H$ 函数的不同， $g_\mathrm{out}$ 的形式也截然不同。因此，接下来我们要对 $g_\mathrm{out}$ 进行推导，也即推导 $H$ 的一阶导：
$\begin{aligned} &H^{\prime}\left(\widehat{p}, y, \mu^{p}\right) \\ &\quad=\frac{\partial}{\partial \widehat{p}} \log \int p_{Y \mid Z}(y \mid z) \frac{1}{\sqrt{2 \pi \mu^{p}}} \exp \left(-\frac{1}{2 \mu^{p}}(z-\widehat{p})^{2}\right) d z \\ &=\frac{\partial}{\partial \widehat{p}}\left\{\log \frac{1}{\sqrt{2 \pi \mu^{p}}}+\log \int_{z} \exp \left(\log p_{Y \mid Z}(y \mid z)-\frac{1}{2 \mu^{p}}(z-\widehat{p})^{2}\right) d z\right\} \\ &=\frac{\partial}{\partial \widehat{p}}\left\{-\frac{\widehat{p}^{2}}{2 \mu^{p}}+\log \int \exp \left(\log p_{Y \mid Z}(y \mid z)-\frac{z^{2}}{2 \mu^{p}}+\frac{\widehat{p} z}{\mu^{p}}\right) d z\right\} \\ &=-\frac{\widehat{p}}{\mu^{p}}+\frac{\partial}{\partial \widehat{p}} \log \left[\mu^{p} \int \exp (\phi(u)+\widehat{p} u) d u\right] \text { via } u \triangleq \frac{z}{\mu^{p}} \\ &=-\frac{\widehat{p}}{\mu^{p}}+\frac{\partial}{\partial \widehat{p}} \log \int \exp (\phi(u)+\widehat{p} u) d u \end{aligned}$
记 $Z(\widehat{p}) \triangleq \int \exp (\phi(u)+\widehat{p} u) d u$ ，我们有如下数学公理：
$\begin{aligned} &\frac{\partial}{\partial \widehat{p}} \log Z(\widehat{p})=\mathrm{E}\{u \mid \widehat{p}\} \text { with } p_{U \mid P}(u \mid \widehat{p})=\frac{\exp (\phi(u)+\hat{p} u)}{Z(\hat{p})} \\ &\frac{\partial^{2}}{\partial \widehat{p}^{2}} \log Z(\widehat{p})=\operatorname{var}\{u \mid \widehat{p}\} \text { with } p_{U \mid P}(u \mid \widehat{p})=\frac{\exp (\phi(u)+\hat{p} u}{Z(\hat{p})} . \end{aligned}$
可以通过简单的求导法则验证，这是正确的。因此，
$\begin{aligned} H^{\prime}\left(\widehat{p}, y, \mu^{p}\right) &=-\frac{\widehat{p}}{\mu^{p}}+\int u \frac{\exp (\phi(u)+\widehat{p} u)}{Z(\hat{p})} d u \\ &=-\frac{\widehat{p}}{\mu^{p}}+\int \frac{z}{\mu^{p}} \frac{\exp \left(\log p_{Y \mid Z}(y \mid z)-\frac{z^{2}}{2 \mu^{p}}+\frac{z \widehat{p}}{\mu^{p}}\right)}{Z(\widehat{p})} \frac{d z}{\mu^{p}} \text { via } u \triangleq \frac{z}{\mu^{p}} \\ &=-\frac{\widehat{p}}{\mu^{p}}+\frac{1}{\mu^{p}} \int z \frac{\exp \left(\log p_{Y \mid Z}(y \mid z)-\frac{1}{2 \mu^{p}}(z-\widehat{p})^{2}\right)}{\mu^{p} Z(\widehat{p}) \exp \left(-\frac{p^{2}}{2 \mu^{p}}\right)} d z \\ &=-\frac{\widehat{p}}{\mu^{p}}+\frac{1}{\mu^{p}} \int z \frac{p_{Y \mid Z}(y \mid z) \mathcal{N}\left(z ; \widehat{p}, \mu^{p}\right)}{\int p_{Y \mid Z}(y \mid \bar{z}) \mathcal{N}\left(\bar{z} ; \hat{p}, \mu^{p}\right) d \bar{z}} d z \\ &=\frac{1}{\mu^{p}}\left(\mathrm{E}\left\{z \mid y, \widehat{p} ; \mu^{p}\right\}-\widehat{p}\right) \end{aligned}$
因此，我们有：
$g_{\text {out }}\left(\widehat{p}, y, \tau^{p}\right):=\frac{1}{\tau^{p}}\left(\widehat{z}^{0}-\widehat{p}\right), \quad \widehat{z}^{0}:=\mathbb{E}\left(z \mid \widehat{p}, y, \tau^{p}\right)$
这也是和MAP区别开的地方。类似地可以得到：
$-\frac{\partial}{\partial \widehat{p}} g_{\text {out }}\left(\widehat{p}, y, \tau^{p}\right)=\frac{1}{\tau^{p}}\left(1-\frac{\operatorname{var}\left(z \mid \widehat{p}, y, \tau^{p}\right)}{\tau^{p}}\right)$
至此， $\Delta_{i \rightarrow j}$ 算是可以被近似得到了。接下来估计 $\Delta_{i \leftarrow j}$ ，把(6)的结果代入可得到：
$\begin{aligned} &\Delta_{i \leftarrow j}\left(t+1, x_{j}\right) \approx \mathrm{const} \\ &\quad+\quad f_{\mathrm{in}}\left(x_{j}, q_{j}\right)-\frac{1}{2 \tau_{i \leftarrow j}^{r}(t)}\left(\widehat{r}_{i \leftarrow j}(t)-x_{j}\right)^{2} \end{aligned}$
其中，
$\begin{aligned} \frac{1}{\tau_{i \leftarrow j}^{r}(t)} &=\sum_{\ell \neq i} a_{\ell j}^{2} \tau_{\ell}^{s}(t) \\ \widehat{r}_{i \leftarrow j}(t) &=\tau_{i \leftarrow j}^{r}(t) \sum_{\ell \neq i}\left[s_{\ell}(t) a_{\ell j}+a_{\ell j}^{2} \tau_{\ell}^{s}(t) \widehat{x}_{j}(t)\right] \\ &=\widehat{x}_{j}(t)+\tau_{i \leftarrow j}^{r}(t) \sum_{\ell \neq i} s_{\ell}(t) a_{\ell j} \end{aligned}$
这步和MAP的步骤是完全一样。接下来，我们注意到：
$\begin{aligned} &p_{\Delta_{i \leftarrow j}(t, \cdot)}\left(x_{j}\right)\propto \exp \Delta_{i\leftarrow j}\left(t, x_{j}\right) \\ &\quad \approx \frac{1}{Z} \exp F_{\mathrm{in}}\left(x_{j}, \widehat{r}_{i \leftarrow j}(t), q_{j}, \tau_{i \leftarrow j}^{r}(t)\right) \end{aligned}$
其中，
$F_{\mathrm{in}}\left(x, \widehat{r}, q, \tau^{r}\right):=f_{\mathrm{in}}(x, q)-\frac{1}{2 \tau^{r}}(\widehat{r}-x)^{2}$
注意到这又是熟悉的高斯分布变量的指数项，因此，如果定义：
$g_{\text {in }}\left(\widehat{r}, q, \tau^{r}\right):=\mathbb{E}[X \mid \widehat{R}=\widehat{r}, Q=q]$
这里的期望是对变量 $\widehat{R}=X+V, \quad V \sim \mathcal{N}\left(0, \tau^{r}\right)$
进行求取。
则我们有： $\widehat{x}_{i \leftarrow j}(t+1) =\mathbb{E}\left[x_{j} \mid \Delta_{i \leftarrow j}(t, \cdot)\right]\approx g_{\text {in }}\left(\widehat{r}_{i \leftarrow j}(t), q_{j}, \tau_{i \leftarrow j}^{r}(t)\right)$
至此，剩余步骤的推导都和MAP算法一致。也就是说，两个版本的GAMP算法的不同仅仅体现在 $g_\mathrm{out}$ 和 $g_\mathrm{in}$ 上。作者做了一个表格用以对比：
在这里插入图片描述
由于MMSE 版本和 MAP 版本高度相似，这篇的推导写的较为简略。没有关系，我们重点聚焦在对GAMP算法的使用之上。而从 GAMP 算法的框图之中：

可以看到，只有 $\hat{s}_i$ 即 $g_\mathrm{out}$ , $\tau_{i}^s$ , $\hat{x}_j$ 即 $g_\mathrm{in}$ 和 $\tau_j^x$ 是需要推导的，其他的都是流水线无脑操作即可。接下来我们以实例来展示。

AWGN 场景

我们考虑AWGN输出场景，即 $y = A x + n$ , 其中 $n\sim\mathcal{CN}(0,\tau_w)$ 为高斯白噪声。此时我们有：
$f_{\text {out }}(z, y):=\log p_{Y \mid Z}(y \mid z)=const + \frac{1}{2\tau_w}(z-y)^2$
那么推导MAP版本的 $g_\mathrm{out}$ 为：
$g_\mathrm{out}=\left(\widehat{z}^{0}-\widehat{p}\right) / \tau^{p}$
其中
$\widehat{z}^{0}:=\arg \max _{z} F_{\text {out }}\left(z, \widehat{p}, y, \tau^{p}\right)$
而
$F_{\text {out }}\left(z, \widehat{p}, y, \tau^{p}\right):=f_{\text {out }}(z, y)-\frac{1}{2 \tau^{p}}(z-\widehat{p})^{2}= -\frac{1}{2\tau_w}(z-y)^2 - \frac{1}{2 \tau^{p}}(z-\widehat{p})^{2}$
那么上式对 $z$ 求导，得到：
$(\frac{1}{\tau^p} + \frac{1}{\tau_w})z= \frac{1}{\tau_w}y+ \frac{1}{\tau^p}\hat{p},$
因此
$\hat{z}^0 = \frac{\tau^py + \tau_w\hat{p}}{\tau^p + \tau_w}\\g_\mathrm{out}=\frac{y-\hat{p}}{\tau^p+\tau_w}.$
那么很轻易又有：
$-\frac{\partial}{\partial \widehat{p}} g_{\text {out }}\left(\widehat{p}, y, \tau^{p}\right)=\frac{1}{\tau^{p}+\tau^{w}}$

再考虑 MMSE 版本。其 $g_\mathrm{out}$ 函数定义为：
$g_{\mathrm{out}}\left(\widehat{p}, y, \tau^{p}\right):=\frac{1}{\tau^{p}}\left(\widehat{z}^{0}-\widehat{p}\right), \quad \widehat{z}^{0}:=\mathbb{E}\left(z \mid \widehat{p}, y, \tau^{p}\right)$
其中，变量 $z$ 服从分布：
$p\left(z \mid \widehat{p}, y, \tau^{p}\right) \propto \exp F_{\text {out }}\left(z, \widehat{p}, y, \tau^{p}\right)= -\frac{1}{2\tau_w}(z-y)^2 - \frac{1}{2 \tau^{p}}(z-\widehat{p})^{2}$
这里注意到，事实上式可以看做是两个高斯变量PDF乘积的形式，而这已有定理，那就是上式仍是一个高斯变量的PDF，
即：
$p\left(z \mid \widehat{p}, y, \tau^{p}\right) \sim \mathcal{N}\left(\widehat{z}^{0}, \tau^{z}\right)$
且均值和方差分别为：
$\begin{aligned} \widehat{z}^{0} &:=\widehat{p}+\frac{\tau^{p}}{\tau^{w}+\tau^{p}}(y-\widehat{p}) \\ \tau^{z} &:=\frac{\tau^{w} \tau^{p}}{\tau^{w}+\tau^{p}} \end{aligned}$
具体的推导细节可以参考这篇博客 https://blog.csdn.net/chaosir1991/article/details/106910668/.
那么代入到 $g_\mathrm{out}$ 中，有：
$g_\mathrm{out}=\frac{y-\hat{p}}{\tau^p+\tau_w}.$
因此，在输出为AWGN的场景下， MAP 和 MMSE 完全等价。

接下来，同样考虑输入也是 AWGN 场景，即：
$p_{X \mid Q}(x \mid q)=\mathcal{N}\left(q, \tau^{x 0}\right)$
那么根据定义， MAP 版本为：
$g_{\text {in }}\left(\widehat{r}, q, \tau^{r}\right):=\underset{x}{\arg \max } F_{\text {in }}\left(x, \widehat{r}, q, \tau^{r}\right)$
其中，
$F_{\text {in }}\left(x, \widehat{r}, q, \tau^{r}\right):=f_{\text {in }}(x, q)-\frac{1}{2 \tau^{r}}(\widehat{r}-x)^{2}=-\frac{1}{2 \tau^{x0}}(q-x)^{2}-\frac{1}{2 \tau^{r}}(\widehat{r}-x)^{2}$
同样，对 $x$ 求导，可得：
$g_{\mathrm{in}}\left(\widehat{r}, q, \tau^{r}\right):=\frac{\tau^{x 0}}{\tau^{x 0}+\tau^{r}}(\widehat{r}-q)+q$
也可轻易求得：
$\tau^{r} g_{\mathrm{in}}^{\prime}\left(\widehat{r}, q, \tau^{r}\right) \quad:=\frac{\tau^{r}}{1-\tau^{r} f_{\mathrm{in}}^{\prime \prime}(\widehat{x}, q)}=\frac{\tau^{x 0} \tau^{r}}{\tau^{x 0}+\tau^{r}}.$
而 MMSE 版本中则有：
$g_{\text {in }}\left(\widehat{r}, q, \tau^{r}\right):=\mathbb{E}[X \mid \widehat{R}=\widehat{r}, Q=q]$
其中
$\widehat{R}=X+V, \quad V \sim \mathcal{N}\left(0, \tau^{r}\right)$
那么根据贝叶斯公式我们有：
$p(x|r,q)=\frac{p(r|x)p(x|q)}{p(r)}\propto p(r|x)p(x|q)$
而右边这个，又正是刚刚说到的：两个高斯分布PDF之积仍是高斯分布PDF，其均值方差和上面用到的一样。具体，其均值为：
$g_{\text {in }}\left(\widehat{r}, q, \tau^{r}\right) \quad:=\frac{\tau^{x 0}}{\tau^{x 0}+\tau^{r}}(\widehat{r}-q)+q.$
这再次和 MAP 版本一致。那么也有：
$\tau^{r} g_{\mathrm{in}}^{\prime}\left(\widehat{r}, q, \tau^{r}\right):=\frac{\tau^{x 0} \tau^{r}}{\tau^{x 0}+\tau^{r}}.$