强化学习
文章平均质量分 85
weixin_45650561
这个作者很懒,什么都没留下…
展开
-
多线程、并行、多进程、异步、同步
多线程和并行的理解及区别1、什么是多线程2、什么是并行3、其他概念由于需要,最近要用到dppo(Distributed Proximal Policy Optimization)算法。Google deepmind论文中多个机器人传递给中央大脑的是在不同环境收集数据的梯度gradient,然后中央大脑利用得到的梯度进行更新;而openai的文论用的是单线程,莫烦将这两个结合,写出了多线程的DPPO算法,多个机器人将自己的transition传递给中央大脑,而非gradient,然后中央大脑根据多个机器原创 2021-04-25 10:32:17 · 388 阅读 · 0 评论 -
多进程强化学习训练踩坑记录
使用强化学习训练足式机器人历程记录使用强化学习训练足式机器人2021.4.13目前主要存在两大问题:1)训练出来的神经网络与机器人初始位置有关系2)15°爬坡爬不上去原创 2021-04-25 10:22:35 · 430 阅读 · 0 评论 -
强化学习-08--PPO
PPO原创 2020-11-11 21:36:02 · 1362 阅读 · 0 评论 -
强化学习-07--DPG、DDPG
DPG、DDPG原创 2020-11-11 21:34:41 · 528 阅读 · 0 评论 -
paper3-Asynchronous Methods for Deep Reinforcement Learning
这里写目录标题一、新收获1、对文章段落的理解和收获abstract(1). Introduction(2). Related Work(3). Reinforcement Learning Background(4). Asynchronous RL Framework(5). Experiments(6). Conclusions and Discussion二、总结一、新收获1、对文章段落的理解和收获abstract(1). Introduction(2). Related Work(3).原创 2020-09-01 20:51:14 · 147 阅读 · 0 评论 -
强化学习-06--A3C
A3C原创 2020-08-30 16:02:45 · 161 阅读 · 0 评论 -
强化学习-05--A2C
A2C原创 2020-08-23 17:10:16 · 504 阅读 · 0 评论 -
强化学习-04--actor-critic
actor-critic原创 2020-08-21 15:00:40 · 426 阅读 · 0 评论 -
强化学习-03--policy gradient
policy gradient原创 2020-08-05 11:03:58 · 164 阅读 · 0 评论 -
paper2-Policy Gradient Methods for Reinforcement Learning with Function Approximation
Policy Gradient Methods for Reinforcement Learning with Function Approximation一、新收获1、对文章段落的理解和收获abstract(1)、Policy Gradient Theorem二、问题残留--待解决1、三、结束一、新收获1、对文章段落的理解和收获abstract直接指出policy gradient是根据期望奖励的梯度更新参数的。本文提出的主要新方法为:梯度可以 以近似作用值(an approximate act原创 2020-08-05 09:56:59 · 582 阅读 · 0 评论 -
强化学习-02--DQN
DQN原创 2020-07-30 16:27:50 · 105 阅读 · 0 评论 -
强化学习-01--Q-learning,Sarsa
Q-learning,Sarsa原创 2020-07-30 09:20:45 · 108 阅读 · 0 评论 -
paper 1:Playing Atari with Deep Reinforcement Learning
Playing Atari with Deep Reinforcement Learning新收获问题残留--待解决1、强化学习中的online,offline,on-policy,off-policy是什么意思,有什么区别?2、卷积神经网络的参数啥的还没有弄明白。结束本来打算把这篇文献翻译一下,然后再把自己的理解和问题写出来,但是百度一下,会发现有许多翻译,所以便把翻译的念头打消了,就写一下自己看这篇文献的收获和目前自己还存在的问题(以后把这些问题有解决的,会同步在这里更新的)。想看文献翻译的,推荐下原创 2020-07-28 11:15:35 · 80 阅读 · 0 评论