Reference
推荐系统的召回策略
架构
1.离线方式:离线的model file算出推荐结果,这些推荐结果可以是用户喜欢哪些item,也可以是item之间的相似度文件,然后写入KV存储,在线的server recall部分直接调用这个结果,拿到ID之后访问detail server得到详情,再往rank部分传递。
2.半在线模式:将model file算出来的item embedding也存入KV,然后tf-server调用在线model 生成 user embedding,然后通过两个embedding打分。
优化
冷启动问题
1.利用WALS进行预测。给定一个在训练集中未出现的item,如果系统与用户有一些交互,则系统可以很容易计算出该item的Embedding,而无需重新训练整个模型。只需求解以下方程式或其加权形式:
上述方程对应于WALS中的一个迭代:用户Embedding保持固定,系统求解item的Embedding。对于新用户也可以这样做。
2.启发式生成新item的Embedding。如果系统没有相应的交互信息,则系统可以通过对来自同一类别,来自同一上传者(在视频推荐中)的item的Embedding进行平均来近似其Embedding。