对Tensor Ring Decomposition with Rank Minimization onLatent Space一文求解算法部分公式的推导

cug第一深情

已于 2022-07-03 23:47:07 修改

阅读量293

点赞数

文章标签：算法机器学习

于 2022-07-03 23:41:59 首次发布

本文链接：https://blog.csdn.net/qq_45968933/article/details/125591660

版权

本文所要优化的目标函数:
$\quad \sum_{n=1}^N \sum_{i=1}^3 \|G^{(n)}_{(i)}\|_*+\frac{\alpha}{2}\|X-\psi([G])\|_F^{2}$
$P_{\Omega}(\mathcal{X})=P_{\Omega}(\mathcal{T})$

其中 $\mathcal{X}是只有部分真实点 \quad \mathcal{T}中包括所有的真实点$

接下来需要采用 $A D M M$ 算法进行该目标函数的求解
- 首先由于 $T R L R F$ 模型的变量是相互依赖的，添加辅助变量来简化优化
  $\large \rightarrow min \quad \sum_{n=1}^N \sum_{i=1}^3 \|G^{(n)}_{(i)}\|_*+\frac{\alpha}{2}\|X-\psi([G])\|_F^{2}$
  添加辅助变量 $\mathcal{M}$ ,然后通过扩展拉格朗日乘子法改写目标函数形式
  $\large \rightarrow min \quad \sum_{n=1}^N \sum_{i=1}^3 (\|M^{(n,i)}_{(i)}\|_* + <\mathcal{Y}^{(n,i)},M^{(n,i)}-G^{(n)}> + \frac{\mu}{2} \| M^{(n,i)}-G^{(n)} \|_F^{2}) +\frac{\alpha}{2} \|X-\psi([G])\|_F^{2}$
  $\large s.t. \mathcal{M}_{(i)}^{(n,i)}=\mathcal{G}_{(i)}^{(n)}$
  $\large s.t. P_{\Omega}(\mathcal{X})=P_{\Omega}(\mathcal{T})$
第一步，对 $G^{(n)}$ 进行更新
- 将 $G^{(n)}$ 看作是一个变量，然后对目标函数关于 $G^{(n)}$ 进行求导,导数如下：
  $\large \rightarrow \sum_{i=1}^3(-\mathcal{Y}^{(n,i)} -\mu(M^{(n,i)}-G^{(n)})+ (\frac{\alpha}{2} \|X-\psi([G])\|_F^{2})^{'}$
  $\large \rightarrow 求该导数的原函数$
  $\large \rightarrow \int \sum_{i=1}^3 \mu(-\frac{1}{\mu} \mathcal{Y}^{(n,i)} - M^{(n,i)}+G^{(n)})d(G^{(n)}) + \frac{\alpha}{2} \|X-\psi([G])\|_F^{2}+C_{G}$
  $\large \rightarrow \sum_{i=1}^3 \frac{\mu}{2}\|M^{(n,i)}-G^{(n)}+\frac{1}{\mu} \mathcal{Y}^{(n,i)} \|_F^{2} + \frac{\alpha}{2} \|X-\psi([G])\|_F^{2}+C_{G}$
- 这是一个最小二乘问题，对其更新就要求他的最小值，做法便是对该目标函数进行求导，令其为零即可：
  $\large \rightarrow \sum_{i=1}^3(-\mathcal{Y}^{(n,i)} -\mu(M^{(n,i)}-G^{(n)})+ (\frac{\alpha}{2} \|X-\psi([G])\|_F^{2})^{'}$
  $\large \rightarrow \sum_{i=1}^3(-\mathcal{Y}^{(n,i)} -\mu M^{(n,i)}+\mu G^{(n)})+\alpha(X-\psi([G]))(\psi([G]))^{'}$
  令该导数为零，即得到如下等式：
  $\large \rightarrow \sum_{i=1}^3(\mathcal{Y}^{(n,i)} +\mu M^{(n,i)}-\mu G^{(n)})=\alpha(\psi([G]-X))(\psi([G]))^{'}$
  其中在模-2展开的情形下 $(\psi([G]))^{'}=G^{(\neq n)}_{(2)}$
  $\large \rightarrow \sum_{i=1}^3(\mathcal{Y}^{(n,i)}_{(2)} + \mu M^{(n,i)}_{(2)}-\mu G^{(n)}_{(2)}) =\alpha(G^{(n)}_{(2)}G^{(\neq n,T)}_{(2)}-X_{(n)}))G^{(\neq n)}_{(2)}$
  $\large \rightarrow \sum_{i=1}^3(\mathcal{Y}^{(n,i)}_{(2)} + \mu M^{(n,i)}_{(2)}-\mu G^{(n)}_{(2)}) =\alpha G^{(n)}_{(2)} G^{(\neq n,T)}_{(2)} G^{(\neq n)}_{(2)}-\alpha X_{(n)}G^{(\neq n)}_{(2)}$
  $\large \rightarrow \alpha G^{(n)}_{(2)} G^{(\neq n,T)}_{(2)} G^{(\neq n)}_{(2)}+3\mu G^{(n)}_{(2)} =\sum_{i=1}^3(\mathcal{Y}^{(n,i)}_{(2)}+\mu M^{(n,i)}_{(2)})+\alpha X_{(n)}G^{(\neq n)}_{(2)}$
  $\large \rightarrow G^{(n)}_{(2)}(\alpha G^{(\neq n,T)}_{(2)} G^{(\neq n)}_{(2)}+3\mu I) =\sum_{i=1}^3(\mathcal{Y}^{(n,i)}_{(2)}+\mu M^{(n,i)}_{(2)})+\alpha X_{(n)}G^{(\neq n)}_{(2)}$
  $\large \rightarrow G^{(n)}_{(2)}=(\sum_{i=1}^3(\mathcal{Y}^{(n,i)}_{(2)}+\mu M^{(n,i)}_{(2)})+\alpha X_{(n)}G^{(\neq n)}_{(2)}) (\alpha G^{(\neq n,T)}_{(2)} G^{(\neq n)}_{(2)}+3\mu I)^{-1}$
  然后两边同时进行模-2收缩，便可以得到关于 $G^{(n)}$ 的更新公式
第二步，对 $M^{(n,i)}$ 进行更新
- 与上述更新方式相同，可以先写出 $L ()$ 关于 $M^{(n,i)}$ 的表达式，然后求导，令其结果为零即可。
  $\large \rightarrow L(M^{(n,i)})=\|M^{(n,i)}_{(i)}\|_{*}+\frac{\mu}{2} \|M^{(n,i)}-G^{(n)} + \frac{1}{\mu}\mathcal{Y}^{(n,i)} \|_F^{2}+C_M$
  对其进行求导操作，其中比较困难的是关于矩阵核范数求导，一般有两种方法，第一种方法是 $S V T$ (论文中经常用的方法，第二种是利用定义进行证明(不一定对于所有的都适用))
  $1 、 S V T 算法$
  $\quad 1:对于任意的\mu >0 并且Y \in R^{n_1 \times n_2} 符合如下形式的最优解为：$
  $D_{\mu}(Y)=argmin_x\{\frac{1}{2}\|X-Y\|_F^{2}+\mu\|X\|_*\}$
  其中 $D_{\mu}()$ 操作称之为 $S V T$ ，算法思想如下
  (1)对 $Y$ 进行奇异值分解为 $\sum V^T$ ,其中 $\sum$ 是包含奇异值的矩阵，接下来 $U$ 和 $V$ 保持不变，然后对所有的奇异值减去 $\mu$ 的操作，如果该奇异值小于 $\mu$ 则令其为零。
  $\large \rightarrow D_{\mu}(Y)=Udiag{(\sigma_i-\mu)}_+V$
  接下来可以对该目标函数通过SVT的方法求解最优解
  $\large \rightarrow$ 可以看出该目标函数中的 $Y=G^{(n)}-\frac{1}{\mu}\mathcal{Y}^{(n,i)}$
  $\large \rightarrow M^{{(n,i)}}=fold_i(D_{\frac{1}{\mu}} (G^{(n)}_{(i)}-\frac{1}{\mu}\mathcal{Y}^{(n,i)}_{(i)}))$
第三步，对 $X$ 进行更新，
- 这一步比较容易，因为观测点的值是给定的，剩下的点由 $G$ 相乘得到
  $\large \rightarrow X=P_{\Omega}(T)+P_{\Omega^{+}}(\psi([G]))$
第四步，对 $\mathcal{Y}^{(n,i)}$ 进行更新
- $\large \rightarrow \mathcal{Y}^{(n,i)}_+=\mathcal{Y}^{(n,i)}+\mu (M^{(n,i)}-G^{(n)})$
第五步，对 $\mu$ 进行更新， $\mu$ 是惩罚项因子，也是随着每一次的迭代需要变化的
- $\large \rightarrow \mu_+=max\{\rho \mu ,\mu_{max}\},1<=\rho<=1.5$ $\rho$ 是一个超参数

cug第一深情

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
对Tensor Ring Decomposition with Rank Minimization onLatent Space一文求解算法部分公式的推导

阅读论文：Tensor Ring Decomposition with Rank Minimization onLatent Space: An Efficient Approach for Tensor Completion对于ADMM算法求解目标函数的公式推导
复制链接

扫一扫