#Paper Reading# Seq2Slate: Re-ranking and Slate Optimization with RNNs

最新推荐文章于 2024-09-04 15:57:09 发布

John159151

最新推荐文章于 2024-09-04 15:57:09 发布

阅读量1.3k

点赞数

分类专栏： paper reading Reinforcement Learning Rerank

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/John159151/article/details/93742293

版权

paper reading 同时被 3 个专栏收录

99 篇文章 4 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

Reinforcement Learning

2 篇文章 0 订阅

订阅专栏

论文题目: Seq2Slate: Re-ranking and Slate Optimization with RNNs
论文地址: https://negative-dependence-in-ml-workshop.lids.mit.edu/wp-content/uploads/sites/29/2019/06/seq2slate_icml_workshop.pdf
论文发表于: ICML 2019（CCF A类会议）

论文大体内容：
本文主要介绍了谷歌团队用一个Seq2Seq的模型来predict下一个观看的视频，以此用于推荐系统的Rerank。

Motivation：
传统的LTR方法更多是序列encoding的方法，就是将各个特征做Embedding，然后根据这些Embedding学习到label的映射。没有其它工作尝试过decoding的方法，这也是本文提出的方法。

Contribution：
本文作者提出使用Seq2Seq的架构来解决item推荐的问题，称为Seq2Slate。这个方法主要是根据用户前面看过的视频序列，来predict下一个观看的视频，应用pointer network框架，进行纯数据驱动学习。

1. 本文使用pointer network[1]如图，左右两边都使用LSTM；

2. 本文使用了每个item是否click的监督信息来做supervised training；

实验
3. Dataset
①Yahoo Learning to Rank Challenge[2]；
②Microsoft Web30k[3]；
③Real-World Data: 大规模商业推荐系统；

4. Baseline
①AdaRank；
②Coordinate Ascent；
③LambdaMART；
④ListNet；
⑤MART；
⑥Random Forests；
⑦RankBoost；
⑧RankNet；

5. Metric
①MAP；
②NDCG；

6. 实验结果

参考资料：
[1] https://zhuanlan.zhihu.com/p/48959800
[2] https://webscope.sandbox.yahoo.com/catalog.php?datatype=c&guccounter=1
[3] https://www.microsoft.com/en-us/research/project/mslr

以上均为个人见解，因本人水平有限，如发现有所错漏，敬请指出，谢谢！

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。