读论文笔记——Jointly Learning to Recommend and Advertise
论文:Jointly Learning to Recommend and Advertise链接:https://arxiv.org/pdf/2003.00097作者:msu+头条预备知识强化学习:假定一个智能体(agent),在一个未知的环境中(当前状态state),采取了一个行动(action),然后收获了一个回报(reward),并进入了下一个状态。最终目的是求解一个策略让agent...
原创
2020-03-31 21:49:10 ·
1884 阅读 ·
3 评论