- 博客(2)
- 收藏
- 关注
原创 多智能体强化学习之值函数分解
多智能体学习有三种范式:集中式学习(Centralized Learning)、独立式学习(Independent Learning)和集中式训练分布式执行(Centralized Training with Decentralized Execution,CTDE)。将整个系统视为一个整体,采用单智能体强化学习算法训练,解决了环境非平稳问题,但需要上帝视角全局通信,不可扩展,无法解决无通信、大规模和大动作空间的问题。
2023-06-28 16:15:09
1584
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人