强化学习
文章平均质量分 93
我从崖边跌落
这个作者很懒,什么都没留下…
展开
-
【强化学习】AlphaGo Zero论文
AlphaGo Zero论文中文版 :Mastering the game of Go without human knowledge 绪论 长久以来,人工智能的目标是在富有挑战性的领域中学习出一种从无知幼儿到超级专家的算法。最近,AlphaGo已经成为第一个在围棋比赛中打败世界冠军的程序。AlphaGo中的树搜索使用深度神经网络来评估棋局和选择动作。这些神经网络是利用人类专...原创 2018-09-05 15:14:58 · 2447 阅读 · 0 评论 -
【强化学习】【图书资料】强化学习在阿里的技术演进与业务创新
《强化学习在阿里的技术演进与业务创新》 https://102.alibaba.com/downloadFile.do?file=1517812754285/reinforcement_learning.pdf 第一章:基于强化学习的实时搜索排序策略调控 第二章:延迟奖赏在搜索排序场景中的作用分析 第三章:基于多智能体强化学习的多场景联合优化 第四章:强化学习在淘宝锦囊推荐系统中的应用 ...原创 2018-12-07 11:11:59 · 1128 阅读 · 0 评论