深度强化学习实验室:一个“开源开放、共享共进”的强化学习学术组织。

实验室面向于深度强化学习领域,涉及深度强化学习环境、理论推导、算法实现、前沿技术与论文解读、开源项目、应用场景、业界资讯、控制博弈论、交叉学科等领域知识。官网:www.neurondance.com/

  • 博客(50)
  • 收藏
  • 关注

原创 第2期技术: Double Q-learning算法原理

Q-Learning算法由于受到大规模的动作值过估计(overestimation)而出现不稳定和效果不佳等现象的存在,而导致overestimation的主要原因来自于最大化值函数(max)逼近,该过程目标是为了最大的累计期望奖励,而在这个过程中产生了正向偏差。而本文章作者巧妙的是使用了两个估计器(double estimator)去计算Q-learning的值函数,作者将这种方法定义了一个名字叫“Double Q-learning”(本质上一个off-policy算法),并对其收敛过程进行了证明(缺点:

2020-09-07 23:31:04 370

原创 第1期技术: DQN算法原理及实现过程

利用神经网络近似值函数的方法表示为:V^(s,w)≈Vπ(s)q^(s,a,w)≈qπ(s,a) \hat{V}(s, w) \approx V_{\pi}(s) \\ \hat{q}(s, a, w) \approx q_{\pi}(s, a) V^(s,w)≈Vπ​(s)q^​(s,a,w)≈qπ​(s,a)那么具体的工作过程是怎样实现的? 以及如何从端到端的过程,本文将讲解Deep Q Network(DQN, 而这正是由DeepMind于2013年和2015年分别提出的两篇论文《Playi

2020-09-07 23:12:48 163

转载 【华为诺亚方舟实验室】2022届毕业生招聘--决策(强化学习)推理方向

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/来源:华为诺亚方舟实验室官微诺亚方舟实验室(...

2021-06-12 10:20:49

转载 【Reward is enough】Sutton、DavidSilver师徒联手:奖励机制足够实现各种目标。

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/作者:小舟、陈萍文章来源:转载自机器之心(链...

2021-06-11 08:58:42 17

原创 【重磅最新】163篇ICML-2021强化学习领域论文整理汇总(2021.06.07)

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/作者:深度强化学习实验室来源:整理自http...

2021-06-07 07:55:28 81

转载 【Easy-RL】中科院-清华-北大3位作者贡献的200页强化学习总结笔记

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/编辑:DeepRL核心贡献者:王琦、杨毅远、...

2021-05-24 10:04:35 36

转载 京东 | AI人才联合培养计划(NLP项目实战)

01 京东AI项目实战课程安排覆盖了从经典的机器学习、文本处理技术、序列模型、深度学习、预训练模型、知识图谱、图神经网络所有必要的技术。项目一、京东健康智能分诊项目第一周:文本处理与特征工...

2021-05-19 14:36:02 9

原创 【重磅推荐: 强化学习课程】清华大学李升波老师《强化学习与控制》

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/编辑:DeepRL《强化学习与控制》是一门由...

2021-05-14 09:36:59 89

转载 【拒绝内卷】狼吃羊的AI奖励机制不合理: 内卷,如何解决?

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/本文转载自:Ai科技评论作者 |耳洞打三金...

2021-03-20 16:39:37 941 1

原创 【重磅推荐】哥大开源“FinRL”: 一个用于量化金融自动交易的深度强化学习库

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/编辑:DeepRL一、关于FinRL目前,深...

2021-03-15 08:05:44 1125 1

转载 【清华&伯克利】提出全新算法RPG,通过奖励随机化发现多智能体游戏中多样性策略行为。

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/作者:本文转载自机器之心编辑、排版:Deep...

2021-03-12 10:56:47 168

转载 【招聘推荐】启元世界招聘"深度强化学习"算法工程师

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/编辑、排版:DeepRL深度强化学习算法工程...

2021-03-12 10:56:47 128 1

转载 【喜报】“深度强化学习实验室”战略合作伙伴”南栖仙策“完成Pre-A轮融资,高瓴创投领投

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/3月10日,南栖仙策宣布获总额数千万元的Pr...

2021-03-10 11:32:41 39

转载 【总结】解决MAPPO(Multi-Agent PPO)问题技巧

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/本文转载自:机器之心清华和UC伯克利联合研究...

2021-03-08 07:52:45 829 1

原创 【最新重磅整理】82篇AAAI2021强化学习领域论文接收列表

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/作者:深度强化学习实验室&AMine...

2021-03-01 08:05:20 452

转载 【华为诺亚方舟实验室】招聘:决策推理(强化学习)研究方向(实习、应届、社招、博后)均可以

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/编辑:DeepRL参与讨论,提问等请注册、登...

2021-02-26 11:46:56 269 1

转载 【Nature重磅】OpenAI科学家提出全新强化学习算法,推动AI向智能体进化

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/编辑:DeepRL近年来,人工智能(AI)在...

2021-02-25 14:31:32 326

原创 【DeepMind】首发并开源Alchemy,一种元强化学习(meta-RL)基准环境。

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/编辑:DeepRL元学习作为一种增加强化学习...

2021-02-15 15:04:39 103 1

转载 深度强化学习实验室(www.neurondance.com)

总结1:周志华 || AI领域如何做研究-写高水平论文总结2:全网首发最全深度强化学习资料(永更)总结3:《强化学习导论》代码/习题答案大全总结4:30+个必知的《人工智能》会议清单总...

2021-02-11 15:37:58 65

转载 NeoRL: 接近真实世界的离线强化学习基准

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/作者:南栖仙策编辑:DeepRL实验室论坛:...

2021-02-10 11:03:12 167

原创 【干货】全面总结(值函数与优势函数)的估计方法

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/作者:高新根博士(DeepRL-Lab研究...

2021-01-25 09:05:50 349

原创 【论文深度研读报告】MuZero算法过程详解

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/作者:饼干Japson(DeepRL-La...

2021-01-19 07:35:00 1034 3

转载 南栖仙策强化学习突破发表NeurIPS 2020论文

深度强化学习实验室官网:http://www.neurondance.com/作者:俞扬编辑:DeepRL什么是强化学习2016 年AlphaGo不仅掀起了人工智能的浪潮,也将一个以往关...

2021-01-15 10:30:33 129

转载 【实验室顾问】俞扬教授 (CCF-IEEE CS青年科学家奖获得者)

深度强化学习实验室官网:http://www.neurondance.com/作者:DeepRL-Lab编辑:DeepRL摘要:CCF与IEEE CS决定授予俞扬博士2020年CCF-I...

2021-01-15 10:30:33 121

原创 【喜报】"深度强化学习实验室"与"南栖仙策"达成战略合作

深度强化学习实验室官网:http://www.neurondance.com/论坛:http://deeprl.neurondance.com/作者:DeepRL-Lab &南...

2021-01-15 10:30:33 152 1

转载 【方法总结】值分布强化学习(Distributional RL)

深度强化学习实验室官网:http://www.neurondance.com/来源:微软研究院AI头条授权转载编辑:DeepRL值分布强化学习(Distributional Reinfo...

2021-01-13 08:24:30 459 1

转载 如何提高"强化学习算法模型"的泛化能力?

深度强化学习实验室官网:http://www.neurondance.com/来源:https://zhuanlan.zhihu.com/p/328287119作者:网易伏羲实验室编辑:...

2021-01-11 08:00:00 601

原创 【书籍推荐】历时3年,清华大学iDLab实验室打造Reinforcement Learning and Control课程及讲义...

深度强化学习实验室官网:http://www.neurondance.com/来源:http://www.idlab-tsinghua.com/作者:清华大学iDLab实验室编辑:De...

2021-01-08 08:00:00 106

原创 重磅 ||《深度强化学习实验室》官网正式上线

深度强化学习实验室官网:www.neurondance.com各位DeepRL研究者、爱好者们,大家好! 2016年AlphaGo横空问世以来,强化学习一直是AI界的热...

2021-01-01 07:57:00 83

转载 【万字总结】基于多智能体强化学习的《星际争霸II》中大师级水平的技术研究

深度强化学习实验室译者:邓雅倩 张媛媛 王晓鹏校订:王敏 罗威编辑:DeepRL摘 要:本文使用基于多智能体强化学习算法,使用人类玩家和智能体对战的游戏数据建立深层神经网络。在...

2020-12-26 07:38:20 605

转载 【DeepMind】新算法MuZero在Atari基准上取得了新SOTA效果,成果问鼎Nature

深度强化学习实验室来源:AI科技评论作者:陈彩娴、青暮编辑:DeepRL近日,DeepMind一篇关于MuZero的论文“Mastering Atari, Go, Chess and ...

2020-12-24 17:35:45 231

转载 【Call for Paper】2nd Workshop on DeepRL for Knowledge Discovery

深度强化学习实验室编辑:DeepRL一、INTRODUCTIOONWhile supervised and unsupervised learning have been extensi...

2020-12-20 15:21:04 52

转载 【IEEE 2021大奖出炉】谷歌AI掌门人Jeff Dean获冯诺依曼奖

作者 | 陈大鑫近日,2021年度IEEE 冯诺伊曼奖项结果正式公布!Google 高级研究员(Senior Fellow)、AI掌门 Jeff Dean摘得本年度奖项,获奖理由为「表彰...

2020-12-20 15:21:04 347 1

原创 【论文复现】一步步详解用TD3算法通关BipedalWalkerHardcore-v2环境

深度强化学习实验室作者:辛靖豪(DeepRL-Lab研究员)编辑:DeepRL熟悉强化学习Gym环境的小伙伴应该对 (BWH-v2环境) BipedalWalkerHardcore-v...

2020-12-16 07:25:00 856 4

原创 【论文复现】Top-K Off-Policy Correction for a REINFORCE RS论文复现

深度强化学习实验室来源:https://zhuanlan.zhihu.com/p/329810387作者:祖守杰(DeepRL-Lab成员)编辑:DeepRL1. 前言做推荐的同学应该多...

2020-12-14 07:40:00 301 5

原创 【综述翻译】Deep Learning for Video Game Playing

深度强化学习实验室原文来源:https://arxiv.org/pdf/1708.07902.pdf翻译作者:梁天新博士编辑:DeepRL在本文中,我们将回顾最近的Deep Learni...

2020-12-04 09:38:29 1869

原创 【第1重磅开源】Paper+Code:腾讯开源TLeague框架,基于竞争博弈的分布式多智能体强化学习框架...

深度强化学习实验室来源:https://arxiv.org/abs/2011.12895v1编辑:DeepRL基于竞争性自学(CSP)的多智能体强化学习(MARL)最近表现出了出惊人的突...

2020-12-01 07:30:00 213 2

转载 【第2重磅】王者荣耀「绝悟」升级,全英雄池解禁

深度强化学习实验室本文转载自 “新智元”作者:QJP、小匀编辑:DeepRL11月28日,由腾讯 AI Lab 与王者荣耀联合研发的策略协作型 AI「绝悟」推出升级版本「绝悟完全体」。...

2020-12-01 07:30:00 234

原创 【干货总结】分层强化学习(HRL)全面总结

深度强化学习实验室来源:https://zhuanlan.zhihu.com/p/267524544作者:脆皮咕(S.Q.Yang)编辑:DeepRL最近做分层强化学习的survey,系...

2020-11-25 07:32:00 3624 1

转载 【顶会论文】165篇CoRL2020 accept论文汇总

深度强化学习实验室来源:CoRL2020会议编辑:DeepRL[1]. Learning a Decision Module by Imitating Driver’s Control ...

2020-11-20 07:35:00 1129

空空如也

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除