召回结构:
训练阶段,通过 预测下一个观看的视频,得到用户和视频的向量表示。
预测阶段:求用户表示向量和视频向量相似度,得到topN推荐。
用户行为是变化的,所以需要实时更新用户近期观看的视频和用户近期搜索的视频,过一下网络,得到用户最新的表示。
每个用户取得训练的样本是相同的,目的是为了抑制活跃用户。
排序结构:
工程trick:对每个用户采用相同的采样个数
关于serving阶段输出 “exp(Wx+b)” 的合理性解释证明,是因为要把用户的观看时长引进来。用户看这个时间越长,几率比就越大。相当于预测用户观看时长。
训练的时候,如果不引入加权逻辑回归(观看时长是权重),则预测的时候,不引入几率比(不引入用户观看时间),直接预测score.