【RS】在线更新RS：How to Retrain Recommendation System (SIGIR‘20)

最新推荐文章于 2024-08-11 02:00:50 发布

chad_lee

最新推荐文章于 2024-08-11 02:00:50 发布

阅读量233

点赞数

分类专栏：论文解读推荐系统文章标签：机器学习深度学习算法

本文链接：https://blog.csdn.net/yanguang1470/article/details/121409684

版权

论文解读同时被 2 个专栏收录

100 篇文章 6 订阅

订阅专栏

推荐系统

61 篇文章 7 订阅

订阅专栏

How to Retrain Recommendation System (SIGIR’20)

模型

当今工业界更新推荐系统的痛点：
$\left(\left\{D_{m}: m \leq t\right\}, W_{t-1}\right) \stackrel{\text { get }}{\longrightarrow} W_{t} \stackrel{\text { test }}{\longleftarrow} D_{t+1} .$
本文希望解决的问题：
$\left(D_{t}, W_{t-1}\right) \stackrel{\text { get }}{\longrightarrow} W_{t} \stackrel{\text { test }}{\longleftarrow} D_{t+1},$
因此提出一个迁移组件：

其中 $W_{t-1}$ 代表之前的推荐系统的参数， $\hat{W_t}$ 代表从新数据 $D_t$ 中学出的推荐系统参数。迁移组件用来结合 $W_{t-1}$ 和 $\hat{W_t}$ 的知识，从而得到新推荐系统 $W_t$ 。

模型经过Transfer模块后，输出还是模型参数。

训练方法

要分为两步训练，在时间 $t$ 时，对应的 $D_t$

Step 1 在 $D_t$ 上学 $\hat{W_t}$ , $\theta$ 固定

虽然是学 $\hat{W_t}$ ，但是也要带着CNN的 $\theta$ ，为了让参数在同一个空间内：
$L_{r}\left(\hat{W}_{t} \mid \overline{D_{t}}\right)=L_{0}\left(f_{\Theta}\left(W_{t-1}, \hat{W}_{t}\right) \mid D_{t}\right)+\lambda_{1}|| \hat{W}_{t} \|^{2}$
其中 $L_0$ 是推荐系统的loss（log loss或者BPR loss）。这时把 $\theta$ 、 $W_{t-1}$ 当作常数。

Step 2 在 $D_{t+1}$ 上学 $\theta$ ， $\hat{W_t}$ 固定

$L_{s}\left(\Theta \mid D_{t+1}\right)=L_{0}\left(f_{\Theta}\left(W_{t-1}, \hat{W}_{t}\right) \mid D_{t+1}\right)+\lambda_{2}|| \Theta \|^{2}$

测试和更新

在测试中，来一批新的数据 $D_{t+1}$ 时，用推荐模型 $W_t$ 测试。

紧接着先用 $D_{t+1}$ 更新参数 $\theta$ ： $L_{s}\left(\Theta \mid D_{t+1}\right)$

然后用 $D_t$ 更新 $\hat{W_t}$ ： $L_{r}\left(\hat{W}_{t} \mid D_{t}\right)$ ，交替这两步。

最后再运行一次第四行，更新 $\theta$ ，计算得到新的 $W_{t} \leftarrow f_{\Theta}\left(W_{t-1}, \hat{W}_{t}\right)$ 。

计算 $\hat{W}_{t+1}$ ： $L_{r}\left(\hat{W}_{t+1} \mid D_{t+1}\right)$

chad_lee

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【RS】在线更新RS：How to Retrain Recommendation System (SIGIR‘20)

How to Retrain Recommendation System (SIGIR’20)模型当今工业界更新推荐系统的痛点：({Dm:m≤t},Wt−1)⟶ get Wt⟵ test Dt+1.\left(\left\{D_{m}: m \leq t\right\}, W_{t-1}\right) \stackrel{\text { get }}{\longrightarrow} W_{t} \stackrel{\text { test }}{\longl
复制链接

扫一扫