清华大学人工智能研究院开源“天授”强化学习平台

最新推荐文章于 2024-04-25 09:48:31 发布

PaperWeekly

最新推荐文章于 2024-04-25 09:48:31 发布

阅读量1k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/105259396

版权

清华大学人工智能研究院基础理论研究中心开源了深度强化学习平台“天授”，它针对非完全信息、不确定条件下的决策问题，提供高效、定制化的训练场景。该平台基于 PyTorch，具有简洁的代码实现、模块化设计、高可复现性和训练速度优势，支持多种主流强化学习算法。此外，团队计划进一步拓展平台支持更多算法和复杂任务，提升性能指标。

摘要由CSDN通过智能技术生成

深度强化学习（deep RL）近年来取得了令人瞩目的进步，在Atari游戏、围棋等领域战胜了人类。但是，在面对不确定环境、不完全信息的任务时仍然面临很大的挑战。如何求解非完全信息、不确定条件下的决策问题成为当前人工智能面临的重要挑战。清华大学人工智能研究院基础理论研究中心聚焦这一问题，开展了一系列理论和关键技术研究，自研了深度强化学习算法平台“天授”，日前向业界开源：

https://github.com/thu-ml/tianshou

“天授”源自《史记》，意为“取天所授而非学自人类”，刻画了强化学习通过与环境进行交互自主学习，而不需要像监督学习一样需要大量人类标注数据。清华大学团队针对目前多数既有强化学习平台（如 RLLib 和 BaseLine）等无法支持高效、定制化的训练场景的问题，继承了首版 TensorFlow“天授 0.1”版在模块化等方面的优势，推出了基于 PyTorch 框架的“天授 0.2”版本。

相比较目前的几种 PyTorch 强化学习平台，多数存在框架结构复杂、二次开发困难、对用户不友好等问题࿰

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。