- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 【假期学习计划】深度强化学习算法与应用培训班
深度强化学习应用与实战培训班内容一、强化学习概述二、马尔科夫决策过程1.马尔可夫性2.马尔可夫决策过程3.策略与价值4.最优化原理5.MDPs扩展三、动态规划1.动态规划2.价值迭代3.策略迭代4.迭代策略评估5.广义策略迭代6.维数灾a.python环境下简单扫地机器人环境b.价值迭代python实现c.策略迭代python实现d.迭代策略评估python实现四、无模型预测学习1.蒙特卡洛方法2.时间差分学习3.n-步回报4.TD(lambda)5.资格迹
2021-09-23 11:43:16 188
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人