VAMP由浅入深（Part-3：状态演进分析数学基础（续））

最新推荐文章于 2024-08-22 23:52:34 发布

Turbo-shengsong

最新推荐文章于 2024-08-22 23:52:34 发布

阅读量761

点赞数 3

分类专栏：消息传递文章标签：线性代数概率论矩阵算法其他

本文链接：https://blog.csdn.net/weixin_43413559/article/details/123105110

版权

消息传递专栏收录该内容

7 篇文章 28 订阅

订阅专栏

文章目录

考虑一般的收敛结论
对定理4的证明
这部分的小结

考虑一般的收敛结论

对任意维度 $N$ ，给定一个正交阵 $\boldsymbol V \in \mathbb R^{N \times N}$ ，以及一个初始向量 $\boldsymbol u_0 \in \mathbb R^N$ ，同时给定两个“干扰”向量（所谓“干扰”向量，不含贬义，这里确实不太知道该怎么翻译比较好）：
$\boldsymbol w_p = (w^p_1,\ldots,w^p_n), \ \boldsymbol w^q=(w^q_1, \ldots, w^q_n)$
其中 $w^p_n \in \mathbb R^{n_p}$ ， $w^q_n \in \mathbb R^{n_q}$ 。构造以下迭代公式：
$\begin{aligned} \boldsymbol p_k &= \boldsymbol V \boldsymbol u_k \\ \alpha_{1k} &= <\pmb f^{\prime}_p(\boldsymbol p_k, \boldsymbol w_p,\gamma_{1k})>, \ \gamma_{2k}=\Gamma_1(\gamma_{1k}, \alpha_{1k}) \\ \boldsymbol v_k &= C_1(\alpha_{1k}) \left[ \pmb f_p(\boldsymbol p_k, \boldsymbol w^p, \gamma_{1k}) - \alpha_{1k } \boldsymbol p_k \right] \\ \boldsymbol q_k &= \boldsymbol V^T \boldsymbol v_k \\ \alpha_{2k} &= <\pmb f^{\prime}_q(\boldsymbol q_k, \boldsymbol w_q,\gamma_{2k})>, \ \gamma_{1,k+1}= \Gamma_2(\gamma_{2k}, \alpha_{2k}) \\ \boldsymbol u_{k+1} &= C_2(\alpha_{2k}) \left [ \pmb f^{}_q(\boldsymbol q_k, \boldsymbol w_q,\gamma_{2k}) -\alpha_{2k} \boldsymbol q_k \right] \tag{91} \end{aligned}$

向量 $\boldsymbol u_0$ 和标量 $\gamma_{10}$ 需要初始化得到，函数 $\pmb f_p, \pmb f_q$ 是元素可分的，即
$\left [ \pmb f_p(\boldsymbol p, \boldsymbol w^p, \gamma_{1}) \right ]_n = f_p( p_n, w_n^p, \gamma_{1}) \\ \left [ \pmb f_q(\boldsymbol q, \boldsymbol w^q, \gamma_{1}) \right ]_n = f_q( q_n, w_n^q, \gamma_{1}) \tag{92}$

我们假设 $\boldsymbol u_0, \boldsymbol w^p, \boldsymbol w^q$ 都是确定的序列，其块成分经验收敛于
$\lim_{N \rightarrow \infty} \{ u_{0n} \} \overset{PL(2)}{=} U_0 \tag{93}$

$\lim_{N \rightarrow \infty} \{ w^p_n \} \overset{PL(2)}{=} W^p , \ \lim_{N \rightarrow \infty} \{ w^q_n \} \overset{PL(2)}{=} W^q \tag{94}$

此外，我们假设初始化的常数 $\gamma_{10}$ 收敛为
$\lim_{N \rightarrow \infty} \gamma_{10} = \bar {\gamma}_{10} \tag{95}$

假设矩阵 $\boldsymbol V \in \mathbb R^{N \times N}$ 均匀分布在正交阵集合中，且独立于 $\boldsymbol u_0, \boldsymbol w^p, \boldsymbol w^q$ 。而且 $\boldsymbol u_0, \boldsymbol w^p, \boldsymbol w^q$ 都是确定的，唯一的随机项只剩矩阵 $\boldsymbol V$ 。
在上述这些假设下，定义状态演进方程：
$\begin{aligned} \bar {\alpha}_{1k} &= \mathbb E \left [ f^{\prime}_p(P_k, W^p, \bar {\gamma}_{1k}) \right ] \\ \tau_{2k} &= C^2_1(\bar {\alpha}_{1k}) \{ \mathbb E \left [ f^{2}_p(P_k, W^p, \bar {\gamma}_{1k}) \right ] - \bar {\alpha}^2_{1k} \tau_{1k} \} \\ \bar {\gamma}_{2k} &= \Gamma_1( \bar {\gamma}_{1k}, \bar {\alpha}_{1k} ) \\ \bar {\alpha}_{2k} &= \mathbb E \left [ f^{\prime}_q(Q_k, W^q, \bar {\gamma}_{2k}) \right ] \\ \tau_{1,k+1} &= C^2_2(\bar {\alpha}_{2k})\{ \mathbb E \left [ f^{2}_q(Q_k, W^q, \bar {\gamma}_{2k}) \right ] -\bar {\alpha}^2_{2k} \tau_{2k} \} \\ \gamma_{1,k+1} &= \Gamma_2(\bar \gamma_{2k}, \bar \alpha_{2k}) \end{aligned} \tag{96}$

其中所求的期望是关于随机变量
$P_k \sim \mathcal N(0, \tau_{1k}), \ Q_k \sim \mathcal N(0, \tau_{2k})$

定理4：考虑式（91）中的迭代式和式（96）中的状态演进方程。另外，对每一次迭代 $k$ ，假设以下三个条件成立：
（1）当 $i = 1, 2$ 时，函数
$C_i(\alpha_i), \ \Gamma_i(\gamma_i, \alpha_i)$

在点 $(\gamma_i, \alpha_i)=(\bar \gamma_{ik}, \bar \alpha_{ik})$ （由状态演进得到）处连续；
（2）当 $\gamma_1=\bar \gamma_{1k}$ 时，函数 $f^{}_p(p, w^p, {\gamma}_{1})$ 及其一阶导 $f^{\prime}_p(p, w^p, {\gamma}_{1})$ 在 $p,w_p)$ 处均匀Lipschitz连续（uniformly Lipschitz continuous）；
（3）当 $\gamma_2=\bar \gamma_{2k}$ 时，函数 $f^{}_q(q, w^q, {\gamma}_{2})$ 及其一阶导 $f^{\prime}_q(q, w^q, {\gamma}_{1})$ 在 $q,w_q)$ 处均匀Lipschitz连续（uniformly Lipschitz continuous）；
那么有如下结论：
（a）对任意给定的 $k$ ， $(\boldsymbol w^p, \boldsymbol p_0, \ldots, \boldsymbol p_k )$ 的块成分几乎经验收敛为
$\lim_{N \rightarrow \infty} \{ (w^p_n,p_{0n},\ldots,p_{kn}) \} \overset{PL(2)}{=} (W^p,P_0,\ldots,P_k) \tag{97}$

其中 $W^p$ 是式（94）极限条件下的随机变量， $(P_0,\ldots,P_k)$ 是一个零均值的高斯随机向量，独立于 $W^p$ ，且 $\mathbb E[P^2_k]=\tau_{1k}$ ，此外我们有
$\lim_{N \rightarrow \infty} (\alpha_{1k}, \gamma_{1k}) = (\bar \alpha_{1k}, \bar \gamma_{1k}) \tag{98}$

（b）对任意给定的 $k$ ， $(\boldsymbol w^q, \boldsymbol q_0, \ldots, \boldsymbol q_k )$ 的块成分几乎经验收敛为
$\lim_{N \rightarrow \infty} \{ (w^q_n,q_{0n},\ldots,q_{kn}) \} \overset{PL(2)}{=} (W^q,Q_0,\ldots,Q_k) \tag{99}$

其中 $W^q$ 是式（94）极限条件下的随机变量， $(Q_0,\ldots,Q_k)$ 是一个零均值的高斯随机向量，独立于 $W^q$ ，且 $\mathbb E[Q^2_k]=\tau_{2k}$ ，此外我们有
$\lim_{N \rightarrow \infty} (\alpha_{2k}, \gamma_{2k}) = (\bar \alpha_{2k}, \bar \gamma_{2k}) \tag{100}$

对定理4的证明

证明方法

采用数学归纳法。给定迭代次数 $\geq 0$ ，定义假设条件 $H_{k,l}$ ：
定理（4）中的（a）到 $k$ 是成立的；
定理（4）中的（b）到 $l$ 是成立的。
数学归纳法的证明将考虑以下三个部分：
（1） $H_{0,-1}$ 正确
（2）若 $H_{k,k-1}$ 正确，则 $H_{k,k}$ 正确
（3）若 $H_{k,k}$ 正确，则 $H_{k+1,k}$ 正确

对初始条件的确认

要说明 $H_{0,-1}$ 是正确的，就是要说明式（97）和（98）在 $k = 0$ 时成立。根据引理5，对任意维度 $N$ ，令 $\boldsymbol U= \boldsymbol I_N$ ，令 $\boldsymbol x = \boldsymbol p_0$ 。因为 $\boldsymbol p_0 = \boldsymbol V \boldsymbol u_0$ ( $\boldsymbol V$ 服从Haar分布)，则
$\lim_{N \rightarrow \infty} {\Vert \boldsymbol p_0 \Vert}^2 = \lim_{N \rightarrow \infty} {\Vert \boldsymbol u_0 \Vert}^2 = \mathbb E[U^2_0]=\tau_{10}$

又因为 $\boldsymbol p_0 = \boldsymbol U \boldsymbol p_0$ ，根据引理5， $\boldsymbol p_0$ 的块成分经验收敛为：
$\lim_{N \rightarrow \infty} \{p_{0n}\} \overset{PL(2)}{=} P_0 \sim \mathcal N(0, \tau_{10})$

结合式（94），
$\lim_{N \rightarrow \infty} \{ w^p_n, p_{0n} \} \overset {PL(2)}{=} (W^p, P_0)$

其中 $W^p$ 独立于 $P_0$ ，这说明了式（97）在 $k = 0$ 时成立。
在式（95）中，我们假设 $\lim_{N \rightarrow \infty} \gamma_{10} \rightarrow \bar \gamma_{10}$ ，此外，当 $\gamma_1 = \bar \gamma_{10}$ 时， $f^{\prime}_p(p,w^p,\gamma_1)$ 在点 $p,w^p)$ 处满足均匀Lipschitz连续，因此
$\alpha_{1k} = <\pmb f^{\prime}_p(\boldsymbol p_k, \boldsymbol w_p,\gamma_{1k})> \rightarrow \mathbb E \left [ f^{\prime}_p(P_k, W^p, \bar {\gamma}_{1k}) \right ]=\bar \alpha_{1k}$

这说明了式（98）在 $k = 0$ 时成立。

数学归纳的推导

该部分要证明 $H_{k,k-1} \Longrightarrow H_{k,k}$ （ $H_{k,k-1} \Longrightarrow H_{k,k}$ 的证明类似）。因此我们固定 $k$ ，并假设 $H_{k,k-1}$ 成立。
因为 $\Gamma_1(\gamma_i,\alpha_i)$ 在点 $(\bar \gamma_{1k}, \bar \gamma_{1k})$ 连续，结合式（98）和式（96）中的 $\bar {\gamma}_{2k} = \Gamma_1( \bar {\gamma}_{1k}, \bar {\alpha}_{1k} )$ 可得
$\lim_{N \rightarrow \infty} \gamma_{2k} = \lim_{N \rightarrow \infty} \Gamma_1(\gamma_{1k}, \alpha_{1k})= \bar \gamma_{2k}$

另外，我们知道， $\forall l \in \{0, \ldots, k \}$ ， $(\boldsymbol w^p, \boldsymbol p_l)$ 的块成分几乎经验收敛为
$\lim_{N \rightarrow \infty} \{ (w^p_n,p_{ln}) \} \overset{PL(2)}{=} (W^p,P_l)$

其中 $P_l \sim \mathcal N(0,\tau_{1l})$ ， $\tau_{1l}$ 由状态演进方程确定。又因为 $f_P(\cdot)$ 为Lipschitz连续函数，且 $C_1(\alpha_{1l})$ 在点 $\bar \alpha_{1l}$ 处连续，因此
$\lim_{N \rightarrow \infty} \{ (w^p_n,p_{ln}, v_{ln}) \} \overset{PL(2)}{=} (W^p,P_l, V_l)$

其中 $V_l$ 是随机变量，
$V_l = \mathrm{g}_p(P_l, W_p, \bar \gamma_{1l}, \bar \alpha_{1l}) \tag{101}$

其中，
$\mathrm g_p(p,w^p,\gamma_1,\alpha_1) \coloneqq C_1(\alpha_1) \left [ f_p(p, w^p,\gamma_1) - \alpha_1 p \right] \tag{102}$

类似地，我们有，

$\lim_{N \rightarrow \infty} \{ (w^q_n,q_{ln}, v_{ln}) \} \overset{PL(2)}{=} (W^q,q_l, V_l)$

其中 $V_l$ 是随机变量，
$U_l = \mathrm{g}_q(Q_l, W_q, \bar \gamma_{2l}, \bar \alpha_{2l}) \tag{103}$

其中，
$\mathrm g_q(q,w^q,\gamma_1,\alpha_1) \coloneqq C_2(\alpha_2) \left [ f_q(q, w^q,\gamma_2) - \alpha_2 q \right] \tag{104}$

定义
$\boldsymbol U \coloneqq [\boldsymbol u_0, \ldots, \boldsymbol u_k] \in \mathbb R^{N \times (k+1)}$

$\boldsymbol V_k, \boldsymbol P_k, \boldsymbol Q_k$ 也做类似定义，让 $G_k$ 表示这些矩阵的元组（ $G_k$ 可简单理解为 $k$ 次迭代为止的事件）
$G_k \coloneqq \{ \boldsymbol U_k, \boldsymbol P_k, \boldsymbol V_k, \boldsymbol Q_{k-1}\} \tag{105}$

此外，我们还把 $G_k$ 理解为是这些变量的 $\sigma-\text{algebra}$ （理解为所有可能集合的一组排列即可）。集合(105)包含了算法（91）在第 $k$ 次迭代 $\boldsymbol q_k = \boldsymbol V^T \boldsymbol v_k$ 之前的所有输出。
定义
$\boldsymbol A_k \coloneqq [\boldsymbol P_k \ \boldsymbol V_{k-1}], \ \boldsymbol B_k \coloneqq [\boldsymbol U_k, \boldsymbol Q_{k-1}] \tag{106}$

则，根据式（91），有
$\boldsymbol A_k = \boldsymbol V \boldsymbol B_k \tag{107}$

由引理4可得，
$\boldsymbol V |_{G_k} \overset{d}{=} \boldsymbol A_k (\boldsymbol A^T_k \boldsymbol A_k)^{-1} \boldsymbol B^T_k + \boldsymbol U_{\boldsymbol A_k^{\bot}} \tilde {\boldsymbol V} \boldsymbol U^T_{\boldsymbol B_k^{\bot}} \tag{108}$

把式（108）代入到算法（91）在第 $k$ 次迭代 $\boldsymbol q_k = \boldsymbol V^T \boldsymbol v_k$ ，表示为
$\boldsymbol q_k =\boldsymbol V^T \boldsymbol v_k = \boldsymbol q_k^{\text{det}} + \boldsymbol q_k^{\text{ran}} \tag{109}$

其中 $\boldsymbol q_k^{\text{det}}$ 是确定的项
$\boldsymbol q_k^{\text{det}} = \boldsymbol B_k (\boldsymbol A^T_k \boldsymbol A_k)^{-1} \boldsymbol A^T_k \boldsymbol v_k \tag{110}$

$\boldsymbol q_k^{\text{ran}}$ 是随机的项
$\boldsymbol q_k^{\text{ran}}= \boldsymbol U_{\boldsymbol B_k^{\bot}} \tilde {\boldsymbol V^T} \boldsymbol U^T_{\boldsymbol A_k^{\bot}} \boldsymbol v_k \tag{111}$

下面将要阐述的引理6、7、8会解释式（110）和式（111）的逼近分布。

引理6：在 $H_{k,k-1}$ 的假设成立下，存在常数 $\beta_{k,0}, \ldots, \beta_{k,k-1}$ ，使得 $(\boldsymbol q_0, \ldots, \boldsymbol q_{k-1},\boldsymbol q_k^{\text{det}} )$ 的块成分经验收敛为
$\lim_{N \rightarrow \infty} \{ w^q_n,q_{0n},\ldots,q_{k-1,n} ,q_{kn}^{\text{det}}\} \overset{PL(2)}{=}(W^q,Q_0,\ldots,Q_{k-1},Q^{det}_k) \tag{112}$

其中 $Q_l, l=0,\ldots,k-1$ 是高斯随机变量（由式99可知），且
$Q^{\text{det}}_k=\beta_{k0} Q_0 + \ldots + \beta_{k,k-1}Q_{k-1} \tag{113}$

证明：使用式（106）的定义
$\boldsymbol{A}_{k}^{T}\boldsymbol{A}_k=\left[ \begin{matrix} \boldsymbol{P}_{k}^{T}\boldsymbol{P}_k& \boldsymbol{P}_{k}^{T}\boldsymbol{V}_{k-1}\\ \boldsymbol{V}_{k-1}^{T}\boldsymbol{P}_k& \boldsymbol{V}_{k-1}^{T}\boldsymbol{V}_{k-1}\\ \end{matrix} \right]$

对 $\boldsymbol{P}_{k}^{T}\boldsymbol{P}_k$ ，有
$\lim_{N \rightarrow \infty} \frac{1}{N} {\left [ \boldsymbol{P}_{k}^{T}\boldsymbol{P}_k \right ]}_{ij} = \frac{1}{N} \boldsymbol p^T_i \boldsymbol p_j=\frac{1}{N} \sum_{n=1}^N p_{in} p_{jn} \overset{b}{=}\mathbb E[P_i P_j] \overset{c}{=}[\boldsymbol Q^p_k]_{ij}$

其中（b）是根据式（97），（c）： $\boldsymbol Q^p_k$ 指协方差矩阵。
类似地，我们定义
$\lim_{N \rightarrow \infty} \frac{1}{N} \boldsymbol V^T_{k-1} \boldsymbol V_{k-1} =\boldsymbol Q^v_k$

对于 $\boldsymbol{A}_{k}^{T}\boldsymbol{A}_k$ 中的交叉项：
$\begin{aligned} \mathbb E[V_iP_j] & \overset{a}{=}\mathbb E[\mathrm{g}_p(P_i,W^p,\bar \gamma_{1i},\bar \alpha_{1i}) P_j] \\ & \overset{b}{=} \mathbb E[\mathrm{g}^{\prime}_p(P_i,W^p,\bar \gamma_{1i},\bar \alpha_{1i}) P_j] \mathbb E[P_iP_j] \\ & \overset{c}{=} \mathbb E[P_iP_j] \left [ \mathbb E [f^{\prime}_p(P_i,W^p,\bar \gamma_{1i})] - \bar \alpha_{1i} \right ] \\ & \overset{d}{=} 0 \end{aligned}$

其中，（a）是因为式（101），（b）是依据Stein引理，（c）是直接依据式（102），（d）是依据式（96）。
因此，
$\lim_{N \rightarrow \infty} \frac{1}{N} \boldsymbol{A}_{k}^{T}\boldsymbol{A}_k \overset{a.s.}{=} \left[ \begin{matrix} \boldsymbol{Q}_{k}^{p}& \boldsymbol{0}\\ \boldsymbol{0}& \boldsymbol{Q}_{k-1}^{v}\\ \end{matrix} \right] \tag{114}$

通过类似的计算，还可以得到
$\lim_{N \rightarrow \infty} \boldsymbol A^T_k \boldsymbol v_k= \left[ \begin{array}{c} \boldsymbol{0}\\ \boldsymbol{b}_{k}^{v}\\ \end{array} \right] \tag{115}$
其中
$\boldsymbol{b}_{k}^{v}=[\mathbb E[V_0V_k], \mathbb E[V_1V_k], \ldots, \mathbb E[V_{k-1}V_k]]^T \tag{116}$

据此可得
$\lim_{N \rightarrow \infty} \frac{1}{N} (\boldsymbol{A}_{k}^{T}\boldsymbol{A}_k)^{-1} \boldsymbol A^T_k \boldsymbol v_k \overset{a.s.}{=} \left[ \begin{array}{c} \boldsymbol{0}\\ \boldsymbol{\beta}_{k}\\ \end{array} \right] \tag{117}$

其中
$\boldsymbol \beta_k \coloneqq [\boldsymbol Q^v_{k-1}]^{-1} \boldsymbol b^v_k$

因此
$\begin{aligned} \boldsymbol q_k^{\text{det}}& = \boldsymbol B_k (\boldsymbol A^T_k \boldsymbol A_k)^{-1} \boldsymbol A^T_k \boldsymbol v_k \\ &= [\boldsymbol U_k, \boldsymbol Q_{k-1}] \left[ \begin{array}{c} \boldsymbol{0}\\ \boldsymbol{\beta}_{k}\\ \end{array} \right] + \boldsymbol \xi \\ &=\sum_{l=0}^{k-1} \beta_{kl} \boldsymbol q_l + \boldsymbol \xi \tag{118} \end{aligned}$

其中 $\boldsymbol \xi$ 表示收敛结果与真实值之间的误差，表示为
$\boldsymbol \xi = \boldsymbol B_k \boldsymbol s, \ \boldsymbol s \coloneqq (\boldsymbol A^T_k \boldsymbol A_k)^{-1} \boldsymbol A^T_k \boldsymbol v_k - \left[ \begin{array}{c} \boldsymbol{0}\\ \boldsymbol{\beta}_{k}\\ \end{array} \right] \tag{119}$

可以证明， $\lim_{N \rightarrow \infty} \frac{1}{N} {\Vert \boldsymbol \xi \Vert}^2 \rightarrow 0$ ，因此
$\lim_{N \rightarrow \infty} \{ w^q_n,q_{0n},\ldots,q_{k-1,n} ,q_{kn}^{\text{det}}\} \overset{PL(2)}{=}(W^q,Q_0,\ldots,Q_{k-1},Q^{det}_k)$

引理7：在 $H_{k,k-1}$ 的假设条件下，
$\lim_{N \rightarrow \infty} \frac{1}{N} {\Vert \boldsymbol U^T_{\boldsymbol A^{\bot}_k} \boldsymbol s_k \Vert}^2 = \rho_k \tag{120}$

证明：
$\begin{aligned} {\Vert \boldsymbol U^T_{\boldsymbol A^{\bot}_k} \boldsymbol s_k \Vert}^2 &= \boldsymbol s_k^T \boldsymbol U_{\boldsymbol A^{\bot}_k} \boldsymbol U^T_{\boldsymbol A^{\bot}_k} \boldsymbol s_k \\ &= \boldsymbol s_k^T (\pmb I - \boldsymbol U_{\boldsymbol A^{}_k} \boldsymbol U^T_{\boldsymbol A^{}_k}) \boldsymbol s_k \\ &= \boldsymbol s_k^T \boldsymbol s_k - \boldsymbol s_k^T \boldsymbol A_k (\boldsymbol A^T_k \boldsymbol A_k)^{-1} \boldsymbol A^T_k \boldsymbol s_k \\ \Longrightarrow \lim_{N \rightarrow \infty} \frac{1}{N} {\Vert \boldsymbol U^T_{\boldsymbol A^{\bot}_k} \boldsymbol s_k \Vert}^2 &= \mathbb E[S^2_k] - (\boldsymbol b^s_k)^T [\boldsymbol Q^s_k]^{-1} \boldsymbol b^s_k \ (\coloneqq \rho_k) \end{aligned}$

引理8：在 $H_{k,k-1}$ 的假设条件下，有
$\lim_{N \rightarrow \infty} \{ (w^q_0, q_{0n},\ldots,q_{k-1,n}, q^{\text{ran}}_{kn}) \} \overset{PL(2)}{=} (W^q, Q_0, \ldots, Q_{k-1}, U_k) \tag{121}$

其中 $U_k \sim \mathcal N(0, \rho_k)$ ，独立于 $(W^q, Q_0, \ldots, Q_{k-1})$ 。
证明：（直接应用引理5）
令 $\boldsymbol x = \tilde {\boldsymbol V}^T \boldsymbol U^T_{\boldsymbol A^{\bot}_k} \boldsymbol v_k$ ，那么
$\boldsymbol q^{\text{ran}}_k= \boldsymbol U_{\boldsymbol B^{\bot}_k} \boldsymbol x_k$
根据引理5即可直接证得
$\boldsymbol q^{\text{ran}}_k \sim \mathcal N(0, \rho_k)$

结合引理6和引理8，可以得到
$\begin{aligned} & \lim_{N \rightarrow \infty} \{ (w^q_0, q_{0n},\ldots,q_{k-1,n}, q^{\text{}}_{kn}) \} \\ & \overset{PL(2)}{=} \lim_{N \rightarrow \infty} \{ (w^q_0, q_{0n},\ldots,q_{k-1,n}, q^{\text{det}}_{kn}+q^{\text{ran}}_{kn}) \} \\ & \overset{PL(2)}{=}(W^q, Q_0, \ldots, Q_{k-1}, Q_k) \} \end{aligned}$

其中 $Q_k$ 是随机变量，满足
$Q^{\text{}}_k=\beta_{k0} Q_0 + \ldots + \beta_{k,k-1}Q_{k-1} + U$

因为 $Q_0, \ldots, Q_{k-1})$ 都是高斯的，并且 $U_k$ 也是高斯，因此 $(W^q, Q_0, \ldots, Q_{k-1}, Q_k)$ 全是高斯。这也就证明了式（99）。

最后，我们证明状态演进方程中的 $\mathbb E[Q^2_k] = \tau_{2k}$ ：
$\begin{aligned} \mathbb E[Q^2_k] & \overset{a}{=} \lim_{N \rightarrow \infty} \frac{1}{N} {\Vert\boldsymbol q_k \Vert}^2 \\ & \overset{b}{=} \lim_{N \rightarrow \infty} \frac{1}{N} {\Vert\boldsymbol v_k \Vert}^2 \\ & \overset{c}{=} \mathbb E[ \mathrm{g}^2_p(P_l, W_p, \bar \gamma_{1k}, \bar \alpha_{1k})] \\ & \overset{d}{=} C^2_1(\bar \alpha_{1k}) \mathbb E \left [ (f_p(p, w^p,\bar \gamma_{1k}) - \bar \alpha_{1k} P_k \right)^2] \\ & \overset{}{=} C^2_1(\bar \alpha_{1k}) \{ \mathbb E[ f^2_p(p, w^p,\bar \gamma_{1k}) ] - 2 \bar \alpha_{1k} \mathbb E[ P_k f_p(p, w^p,\bar \gamma_{1k}) ] + \bar \alpha^2_{1k} \mathbb E[P^2_k] \} \\ & \overset{e}{=} C^2_1 \ (\bar \alpha_{1k}) \{ \mathbb E[ f^2_p(p, w^p,\bar \gamma_{1k}) ] - 2 \bar \alpha_{1k} \tau_{1k} \mathbb E[ f^{\prime}_p(p, w^p,\bar \gamma_{1k}) ] + \bar \alpha^2_{1k} \tau_{1k}\} \\ & \overset{f}{=}C^2_1 \ (\bar \alpha_{1k}) \{ \mathbb E[ f^2_p(p, w^p,\bar \gamma_{1k}) ] - \bar \alpha^2_{1k} \tau_{1k} \} \\ & \overset{e}{=} \tau_k \end{aligned}$

其中（a）是因为 $\boldsymbol q_k$ 经验收敛于 $Q_k$ ，（b）是依据式（91），（c）依据式（101），（e）依据Stein引理，（f）依据式（96）。因此 $\mathbb E[Q^2_k] = \tau_{2k}$ ，这也就完成了 $H_{k,k-1} \Longrightarrow H_{k,k}$ 的证明。

这部分的小结

在前一篇章的基础上，该篇章的主要结论为定理4，它描述了算法（91）在迭代过程中的一些项（ $\boldsymbol p_k, \boldsymbol q_k$ ）的分布会始终保持零均值的高斯分布，这对之后理解VAMP的状态演进分析是重要的。但是，也可以看出，这部分的证明十分繁琐，并且严格建立在Part-2的基础之上（Part-2也需要对矩阵的一些性质有一定理解）。如果认为不容易理解，可以跳过Part-2和Part-3，关注Part-1和后续内容。也许我也只是把理解这些内容看作一种执念，但最起码在推导和撰写的过程中，有了一些不起眼的认识。

Turbo-shengsong

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
VAMP由浅入深（Part-3：状态演进分析数学基础（续））

在前一篇章的基础上，该篇章的主要结论为定理4，它描述了算法（91）在迭代过程中的一些项（\boldsymbol p_k, \boldsymbol q_kp k ,q k ）的分布会始终保持零均值的高斯分布，这对之后理解VAMP的状态演进分析是重要的。
复制链接

扫一扫

专栏目录