论文题目: Seq2Slate: Re-ranking and Slate Optimization with RNNs
论文地址: https://negative-dependence-in-ml-workshop.lids.mit.edu/wp-content/uploads/sites/29/2019/06/seq2slate_icml_workshop.pdf
论文发表于: ICML 2019(CCF A类会议)
论文大体内容:
本文主要介绍了谷歌团队用一个Seq2Seq的模型来predict下一个观看的视频,以此用于推荐系统的Rerank。
Motivation:
传统的LTR方法更多是序列encoding的方法,就是将各个特征做Embedding,然后根据这些Embedding学习到label的映射。没有其它工作尝试过decoding的方法,这也是本文提出的方法。
Contribution:
本文作者提出使用Seq2Seq的架构来解决item推荐的问题,称为Seq2Slate。这个方法主要是根据用户前面看过的视频序列,来predict下一个观看的视频,应用pointer network框架,进行纯数据驱动学习。
1. 本文使用pointer network[1]如图,左右两边都使用LSTM;
2. 本文使用了每个item是否click的监督信息来做supervised training;
实验
3. Dataset
①Yahoo Learning to Rank Challenge[2];
②Microsoft Web30k[3];
③Real-World Data: 大规模商业推荐系统;
4. Baseline
①AdaRank;
②Coordinate Ascent;
③LambdaMART;
④ListNet;
⑤MART;
⑥Random Forests;
⑦RankBoost;
⑧RankNet;
5. Metric
①MAP;
②NDCG;
6. 实验结果
参考资料:
[1] https://zhuanlan.zhihu.com/p/48959800
[2] https://webscope.sandbox.yahoo.com/catalog.php?datatype=c&guccounter=1
[3] https://www.microsoft.com/en-us/research/project/mslr
以上均为个人见解,因本人水平有限,如发现有所错漏,敬请指出,谢谢!