强化学习-读代码懂原理系列
学习强化学习,码代码的能力必须要出众,要快速入门强化学习 搞清楚其中真正的原理,读源码是一个最简单的最直接的方式。最近创建了一系列该类型文章,希望对大家有多帮助。
zachary2wave
五无博士
展开
-
OPENAI Baeslines 详解(十)GAIL
Zee带你看代码系列学习强化学习,码代码的能力必须要出众,要快速入门强化学习 搞清楚其中真正的原理,读源码是一个最简单的最直接的方式。最近创建了一系列该类型文章,希望对大家有多帮助。传送门另外,我会将所有的文章及所做的一些简单项目,放在我的个人网页上。水平有限,可能有理解不到位的地方,希望大家主动沟通交流。邮箱:zachary2wave@163.comThanks for readin...原创 2020-03-18 20:41:50 · 1904 阅读 · 0 评论 -
OPENAI Baeslines 详解(八)PPO2
layout: posttitle: “OPENAI Baeslines 详解(八)OOP2”date: 2019-07-05excerpt: “并行环境的PPO”tags: [openai, baselines, code]comments: trueOPENAI Baeslines 详解(八)PPO2OPENAI 提供了2个版本的PPO PPO1 网上标注是(obsolet...原创 2020-01-26 11:10:44 · 2914 阅读 · 0 评论 -
深度解析OPENAI-MADDPG
Zee带你看RL代码系列学习强化学习,码代码的能力必须要出众,要快速入门强化学习 搞清楚其中真正的原理,读源码是一个最简单的最直接的方式。最近创建了一系列该类型文章,希望对大家有多帮助。另外,我会将所有的文章及所做的一些简单项目,放在文章目录Zee带你看RL代码系列深度解析MADDPGMADDPG原理程序架构ENV 部分具体子环境Make_Worldreset world此外此函数中定义奖励 ...原创 2019-08-26 08:24:55 · 13583 阅读 · 19 评论