强化学习
文章平均质量分 85
姜呆
这个作者很懒,什么都没留下…
展开
-
“贝尔曼方程”那些事儿:含贝尔曼方程详细推导,通俗易懂
贝尔曼方程详细推导,抽丝剥茧,讲清楚为什么这么证明原创 2024-10-09 00:15:00 · 481 阅读 · 1 评论 -
强化学习面试题大全
强化学习面试题大全(持续更新)原创 2022-03-20 13:05:24 · 2695 阅读 · 2 评论 -
Large-Scale Order Dispatch in On-Demand Ride-Hailing Platforms: A Learning and Planning Approach论文精读
Large-Scale Order Dispatch in On-Demand Ride-Hailing Platforms: A Learning and Planning Approach论文来源:滴滴,KDD CUP2018主要涉及方法:马尔科夫决策过程(MDP)、KM算法。本篇也是出行领域非常经典的一篇派单算法,有必要精读!参考解读https://mp.weixin.qq.com/s/rRRYDoeUfiDmDwj_3hKz5A (赞!)http://www.arvinzyy.cn/原创 2022-03-20 00:13:50 · 2445 阅读 · 2 评论