Large-scale Interactive Recommendation with Tree-structured Policy Gradient
最近读了篇论文,链接http://export.arxiv.org/pdf/1811.05869,没什么事情可做,将原文翻译了下,了解下是怎么用树结构做推荐系统的。Large-scale Interactive Recommendation with Tree-structured Policy Gradient摘要:强化学习(RL)最近被引入交互式推荐系统(IRS),因为它可以从动态交互中学习并规划长期性能。由于IRS总是有上千个item(数千个动作)要推荐,大多数现有的基于RL的方法无法处理如此大的
翻译
2021-11-25 14:35:46 ·
331 阅读 ·
0 评论