清华大学人工智能研究院开源“天授”强化学习平台

深度强化学习(deep RL)近年来取得了令人瞩目的进步,在Atari游戏、围棋等领域战胜了人类。但是,在面对不确定环境、不完全信息的任务时仍然面临很大的挑战。如何求解非完全信息、不确定条件下的决策问题成为当前人工智能面临的重要挑战。清华大学人工智能研究院基础理论研究中心聚焦这一问题,开展了一系列理论和关键技术研究,自研了深度强化学习算法平台“天授”,日前向业界开源:

https://github.com/thu-ml/tianshou

“天授”源自《史记》,意为“取天所授而非学自人类”,刻画了强化学习通过与环境进行交互自主学习,而不需要像监督学习一样需要大量人类标注数据。清华大学团队针对目前多数既有强化学习平台(如 RLLib 和 BaseLine)等无法支持高效、定制化的训练场景的问题,继承了首版 TensorFlow“天授 0.1”版在模块化等方面的优势,推出了基于 PyTorch 框架的“天授 0.2”版本。 

相比较目前的几种 PyTorch 强化学习平台,多数存在框架结构复杂、二次开发困难、对用户不友好等问题࿰

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值