自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 【读博客/翻译】A Visual Guide to Evolution Strategies 进化策略的视觉指南

进化策略的视觉指南 A Visual Guide to Evolution Strategiesbrief博客地址 链接这个图首先就好有趣!Survival of the fittest.物竞天择,适者生存下面开始正文:在这篇文章中,我借助一些直观的例子来解释进化策略(ES)是如何工作的。我尽量让方程式保持轻松,如果读者希望了解更多细节,我提供了原始文章的链接。这是一系列文章的第一篇,我计划在这里展示如何将这些算法应用到从MNIST、OpenAI Gym、Roboschool到PyBullet

2020-11-12 10:03:18 810 1

原创 【文献阅读】PS 综述 in Continuous Action Domains: an Overview

Policy Search in Continuous Action Domains: an OverviewAbstractContinuous action policy search is currently the focus of intensive research, driven both by the recent success of deep reinforcement learning algorithms and the emergence of competitors base

2020-10-03 09:55:43 958 1

原创 【文献阅读】ES as a Scalable Alternative to RL(OpenAI 17)

Evolution Strategies as a Scalable Alternative to Reinforcement Learningbrief文章链接该文章是 Open AI 17年发布的,目前有300+的引用量。Abstract【开篇明意】We explore the use of Evolution Strategies (ES), a class of black box optimization algorithms, as an alternative to popular

2020-09-23 20:24:50 1670

原创 【文献阅读】17年进化算法和DRL结合的文章

Improving Exploration in Evolution Strategies for Deep Reinforcement Learning via a Population of Novelty-Seeking AgentsBrief目前该文已经有了上百的引用量,还是有点厉害。文章地址 链接代码链接 code作者来自佛罗里达大学和openAIAbstract【开篇明义】Evolution strategies (ES) are a family of black-box opt

2020-09-14 21:20:11 1219

原创 【文献阅读】Soft Actor-Critic(ERL的前一版)

Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic ActorBrief文章链接paper代码链接code作者Sergey Levine来自加州伯克利分校UC BerkeleyAbstract

2020-09-04 16:51:38 687

原创 【文献阅读】RL经典:Benchmarking Deep Reinforcement Learning for Continuous Control

Benchmarking Deep Reinforcement Learning for Continuous ControlBriefpaper 链接paper开源代码code引用量 300++作者Pieter Abbeel来自UC BerkeleyAbstract鉴于RL领域具有很强的时效性,这篇2016年开源的论文在当时应该是非常轰动的。不过时至今日,...

2020-08-31 10:02:01 1155

原创 【文章阅读】BN(2015)理解Batch Normalization批标准化

Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate ShiftBrief该论文是关于 BN, 引用量300+论文链接paperPieter Abbeel Sergey Levine 作者依然是两位大佬

2020-07-19 21:23:40 836

原创 【文献阅读】进化导向的策略梯度RL

Evolution-Guided Policy Gradient in Reinforcement LearningBrief文章链接 paper代码链接code作者 Kagan Tumer作者 另外一个作者是因特尔人工智能研究院的。Intel AI · Ai-Lab俄勒冈州立大学协作机器人与智能系统研究所Collaborative Robotics and Intelligent Systems Institute Oregon State UniversityAbstract文章是在.

2020-07-15 10:54:19 1155

原创 【文章阅读】连续空间增量式RL(策略松弛和加权权重)

【文章阅读】Incremental Reinforcement Learning in Continuous Spaces via Policy Relaxation and Importance WeightingBriefAbstractIntroduction第一段:第二段:第三段:第四段:第五段:第六段:第七段:BackgroundA. Reinforcement Learning in Continuous Spaces连续空间强化学习B. Related Work相关工作第三章方法设计INCRE

2020-07-14 20:33:08 681

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除