召回:
总结:
- 塔输入全是用户特征。
- 输入特征对 搜索词、观看记录进行item的mean-pooling。
- 双塔也有连续向量,对连续向量进行了x直接入和x²输入,扩大特征的变化。
- item向量和用户观看历史的item也可以用一个Embedding矩阵。
- 样本构建:在导出user向量时,一般都是取用户最近一条的特征。
排序:
损失函数采用加权逻辑回归,把完播率当做视频的权重。进一步优化后续转化。
召回:
总结:
排序:
损失函数采用加权逻辑回归,把完播率当做视频的权重。进一步优化后续转化。