- 博客(1)
- 收藏
- 关注
原创 Datawhale组队学习Task02-马尔可夫决策过程及表格型方法
这里写自定义目录标题Datawhale组队学习Task02-马尔可夫决策过程及表格型方法Markov Decision ProcessQ-learningSarsa(state–action–reward–state–action) Datawhale组队学习Task02-马尔可夫决策过程及表格型方法 本次任务主要学习马尔科夫决策过程(Markov Decision Process, MDP)、TD更新和Sarsa算法,我会将学习的感悟和之前的笔记一遍发布在这篇blog中。 Markov Decision
2020-10-23 21:26:16 175
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人