学习记录 MARL中的credit assignment问题理解 记录平时看到的学到的知识 MARL中的credit assignment问题理解 简单的入门理解:把握两点 不知道每个智能体对总的回报的贡献agent可能会出现懒政,即别人ok了我不探索了