#Paper Reading# Seq2Slate: Re-ranking and Slate Optimization with RNNs

论文题目: Seq2Slate: Re-ranking and Slate Optimization with RNNs
论文地址: https://negative-dependence-in-ml-workshop.lids.mit.edu/wp-content/uploads/sites/29/2019/06/seq2slate_icml_workshop.pdf
论文发表于: ICML 2019(CCF A类会议)

论文大体内容:
本文主要介绍了谷歌团队用一个Seq2Seq的模型来predict下一个观看的视频,以此用于推荐系统的Rerank。

Motivation:
传统的LTR方法更多是序列encoding的方法,就是将各个特征做Embedding,然后根据这些Embedding学习到label的映射。没有其它工作尝试过decoding的方法,这也是本文提出的方法。

Contribution:
本文作者提出使用Seq2Seq的架构来解决item推荐的问题,称为Seq2Slate。这个方法主要是根据用户前面看过的视频序列,来predict下一个观看的视频,应用pointer network框架,进行纯数据驱动学习。

1. 本文使用pointer network[1]如图,左右两边都使用LSTM;

2. 本文使用了每个item是否click的监督信息来做supervised training;

实验
3. Dataset
①Yahoo Learning to Rank Challenge[2];
②Microsoft Web30k[3];
③Real-World Data: 大规模商业推荐系统;

4. Baseline
①AdaRank;
②Coordinate Ascent;
③LambdaMART;
④ListNet;
⑤MART;
⑥Random Forests;
⑦RankBoost;
⑧RankNet;

5. Metric
①MAP;
②NDCG;

6. 实验结果


参考资料: 
[1] https://zhuanlan.zhihu.com/p/48959800
[2] https://webscope.sandbox.yahoo.com/catalog.php?datatype=c&guccounter=1
[3] https://www.microsoft.com/en-us/research/project/mslr

 


以上均为个人见解,因本人水平有限,如发现有所错漏,敬请指出,谢谢!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值