论文阅读-基于深度强化学习的方法解决多智能体防御和攻击问题
本文从深度确定性策略梯度( DDPG )算法出发,引入多智能体深度确定性策略梯度( MADDPG )算法来解决不同情况下的多智能体防御和攻击问题。我们重新构建所考虑的环境,重新定义连续状态空间,连续动作空间和奖励函数,然后应用深度强化学习算法来获得有效的决策策略。为了验证基于DRL的方法的可行性和有效性,进行了多个考虑不同对抗场景的实验。实验结果表明,通过学习智能体可以做出更好的决策,并且使用MADDPG进行学习比使用其他基于DRL的模型取得了更优越的性能,这也说明了掌握其他智能体信息的重要性和必要性。
原创
2023-03-26 09:25:30 ·
1363 阅读 ·
0 评论