强化学习
文章平均质量分 81
MickWang1942
这个作者很懒,什么都没留下…
展开
-
Task04: 演员-评论家算法(Actor-Critic)
介绍AC算法及其变形。原创 2022-09-01 11:44:13 · 2104 阅读 · 0 评论 -
Task04: DQN进阶
介绍工程上 DQN 的一些进阶用法以及连续场景下的解决方案原创 2022-08-31 16:49:41 · 342 阅读 · 0 评论 -
Task04: DQN算法
DQN——结合神经网络的强化学习算法原创 2022-08-29 17:07:18 · 533 阅读 · 0 评论 -
Task02:马尔可夫决策及表格型方法 & Task03: 策略梯度和PPO算法
这篇文章融合了Task02和Task03的内容:(1)马尔科夫决策过程;(2)策略评估;(3)策略改进;原创 2022-08-25 18:35:46 · 322 阅读 · 0 评论 -
Task01:强化学习基础
参加Datawhale-2022-08组队学习笔记记录原创 2022-08-25 17:39:26 · 124 阅读 · 0 评论