Recommending What Video to Watch Next: A Multitask Ranking System

最新推荐文章于 2021-10-12 11:05:00 发布

ChristineC_

最新推荐文章于 2021-10-12 11:05:00 发布

阅读量481

点赞数

分类专栏： Recommendation System

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ChristineC_/article/details/105477605

版权

Recommendation System 专栏收录该内容

18 篇文章 5 订阅

订阅专栏

Time：

Author：Zhe Zhao, Lichan Hong, Li Wei, Jilin Chen, Aniruddh Nath, Shawn Andrews, Aditee Kumthekar, Maheswaran Sathiamoorthy, Xinyang Yi, Ed Chi

Abstract

推荐系统中面临的两大问题：

存在潜在冲突的多目标问题
用户反馈中的implicit selection bias，用户点击某个视频不一定是因为他喜欢，可能是因为这个视频的位置靠前，因此使用这些反馈数据进行模型训练，会导致模型越来越偏

Model Architecture

这篇论文中介绍的模型是对于Wide&Deep模型的拓展

Shallow Tower (Wide)

使用shallow tower去除selection bias，文中使用的特征有位置特征、位置特征X设备信息（因为不同设备上的位置bias是不同的）等。在serving阶段，把position feature设为missing，用1表示。

MMoE (Deep)

多目标排序模型通常使用shared-bottom模型结构，但是对于关联性低的任务，会有损伤。因此，这里使用MMoE进行多目标任务学习。

多目标类别：

参与度目标：点击、观看
满意度目标：喜欢、不喜欢、用户对于推荐的评分

Mixture-of-Experts(MoE)层可以从输入中学习模块化信息，每一个expert可以学习到输入的不同aspect，更好的建模多模态特征空间。所有的experts对于不同的任务是共享的。对于每一个目标，使用一个gating network学习expert的权重。

MoE结构搭在hidden layer之上是因为hidden layer size和input layer size相比会小很多，降低了模型复杂度。

对于任务k，学习n个expert的预测公式如下：

，其中x是lower-level shared hidden embedding，g^k是任务k的gating network，gating network的公式如下：

Experiments

线上使用A/B test进行测试，线下使用AUC/squared loss

Reference

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。