强化学习RL应用在youtube推荐系统 2019谷歌论文解读
目录1、Introduction目前主流的个性化推荐技术的问题:强化学习(RL)应用在推荐系统2、Related workRecommender Systems 推荐系统序列模型和RL推荐系统User Choice Behavior 用户选择行为建模RL with Combinatorial Action Spaces3、MDP模型 马尔可夫决策过程4、Slate-Q:候选值的分解5、用Q-val...
原创
2019-09-18 12:35:48 ·
3138 阅读 ·
0 评论