我看论文里有写到 A full description of hyperparameter search settings, training details, and implementation details are in Appendix C.应该是由附录的啊,可是从[2103.01955] The Surprising Effectiveness of PPO in Cooperative, Multi-Agent Games (arxiv.org)
下载的论文里面没有附录啊,论文里也没有伪代码,或许我下的是不完整版?有人知道哪有完整版吗?
从别的博客看到MAPPO好像迁移到别的环境下效果并不理想 ,有些担心要不要复现一下
明天继续看别人对MAPPO的解读,写自己的总结