《强化学习在阿里的技术演进与业务创新》
https://102.alibaba.com/downloadFile.do?file=1517812754285/reinforcement_learning.pdf
第一章:基于强化学习的实时搜索排序策略调控
第二章:延迟奖赏在搜索排序场景中的作用分析
第三章:基于多智能体强化学习的多场景联合优化
第四章:强化学习在淘宝锦囊推荐系统中的应用
第五章:基于强化学习的引擎性能优化
第六章:基于强化学习分层流量调控
第七章:风险商品流量调控
第八章:虚拟淘宝
第九章:组合优化视角下基于强化学习的精准定向广告OCPC 业务优化
第十章:策略优化方法在搜索广告排序和竞价机制中的应用
第十一章:TaskBot -阿里小蜜的任务型问答技术
第十二章:DRL 导购-阿里小蜜的多轮标签推荐技术