【多智能体强化学习MARL】【MARLlib】

资源存储库

已于 2024-11-16 14:30:04 修改

阅读量984

点赞数 25

分类专栏：算法笔记文章标签：人工智能算法

于 2024-11-16 14:21:44 首次发布

本文链接：https://blog.csdn.net/wq6qeg88/article/details/143816659

版权

MARLlib: 一个多智能体强化学习库

❗ 新闻
2023年3月 ⚓我们很高兴地宣布，一个重大更新刚刚发布。有关详细版本信息，请参阅版本信息。
2023年5月好消息！MARLlib现在支持五个新任务：MATE、GoBigger、Overcooked-AI、MAPDN和AirCombat。快来试试吧！
2023年6月 OpenAI: Hide and Seek和SISL环境已整合到MARLlib中。
2023年8月 🎉MARLlib已被JMLR接受发表。
2023年9月最新的PettingZoo与Gymnasium在MARLlib中兼容。
2023年11月我们正在编写一本关于MARL的实践书籍，并计划在2023年底前发布初稿。

多智能体强化学习库 (MARLlib) 是一个利用Ray及其工具包之一RLlib的MARL库。它提供了一个全面的平台，用于在各种任务和环境中开发、训练和测试MARL算法。

以下是MARLlib的使用示例：

from marllib import marl

# 准备环境
env = marl.make_env(environment_name="mpe", map_name="simple_spread", force_coop=True)

# 使用指定的超参数初始化算法
mappo = marl.algos.mappo(hyperparam_source='mpe')

# 根据环境 + 算法 + 用户偏好构建代理模型
model = marl.build_model(env, mappo, {"core_arch": "mlp", "encode_layer": "128-256"})

# 开始训练
mappo.fit(env, model, stop={'timesteps_total': 1000000}, share_policy='group')