A Survey on Transformers in Reinforcement Learning翻译
强化学习(RL)为序列决策提供了数学形式定义。通过使用RL,我们可以自动获取智能行为。尽管RL已经为基于学习的控制提供了一个通用框架,但深度神经网络的引入,作为一种具有高容量的函数近似方式,在广泛的领域中实现了重大进步。尽管近年来,深度强化学习(DRL)的泛化性取得了巨大的发展,但样本效率问题阻止了其在现实世界应用中的广泛使用。为了解决这个问题,一个有效的机制是将归纳偏置引入DRL框架。DRL中的一个重要归纳偏差是函数近似器结构的选择,例如为DRL agent使用神经网络进行参数化。
翻译
2023-02-17 15:37:56 ·
546 阅读 ·
0 评论