reinforment learning
文章平均质量分 64
JorkerRer
这个作者很懒,什么都没留下…
展开
-
强化学习 — mujoco、mujoco_py、gym 和 baselines的环境配置
和其它的机器学习方向一样,强化学习(Reinforcement Learning)也有一些经典的实验场景,像Mountain-Car,Cart-Pole等。由于近年来深度强化学习(Deep Reinforcement Learning)的兴起,各种新的更复杂的实验场景也在不断涌现。于是出现了OpenAI Gym,MuJoCo,rllab, DeepMind Lab,...转载 2018-07-16 11:30:03 · 27261 阅读 · 8 评论 -
强化学习算法学习汇总笔记 (一) — Q-learning、Sarsa、DQN、Policy Gradients
一. 强化学习的分类1.Model-free 和 Model-based Model-free 即机器人不知道外界环境信息,只能在机器人执行每一步动作后从环境中得到反馈然后去学习,只能按部就班,一步一步等待真实世界的反馈,再根据反馈采取下一步行动。诸如Q Learning, Sarsa,Policy Gradients等算法。Model-based 指机器人对环境有一定的了解,可以对环境进行建模,...转载 2018-07-16 11:34:19 · 8872 阅读 · 3 评论 -
强化学习算法学习汇总笔记 (二) — Actor Critic、DDPG、A3C、
一. Actor Critic1.基本概念 Actor Critic 为类似于Policy Gradient 和 Q-Learning 等以值为基础的算法的组合。a. 其中Actor 类似于Policy Gradient,以状态s为输入,神经网络输出动作actions,并从在这些连续动作中按照一定的概率选取合适的动作action。 b. Critic 类似于 Q-Learning 等以值为基础的算...转载 2018-07-16 11:37:05 · 4145 阅读 · 1 评论 -
mujoco_py No module named _sysconfigdata_nd 错误
今天在配置mujoco_py时遇到错误:birl@birl:~/.mujoco_py$ ./tools/demo.pyTraceback (most recent call last): File "/usr/lib/python2.7/site.py", line 563, in <module> main() File "/usr/lib/python2.7/...原创 2018-07-17 11:12:30 · 1018 阅读 · 0 评论 -
安装gym gazebo
安装gym-gazebo 第一步:安装python3.5.2 参考这个网页的链接安装https://tecadmin.net/install-python-3-5-on-ubuntu/# 第二步:安装opencv3.0 使用python3安装, 参考这个网页的链接安装http://cyaninfinite.com/tutorials/installing-opencv-in-u...转载 2018-07-18 12:39:56 · 1866 阅读 · 0 评论