Stable Baselines官方文档中文版 Github CSDN 尝试翻译官方文档,水平有限,如有错误万望指正 下面这个表格展示了stable baselines项目中采用的所有RL算法及其重要特征:迭代策略、离散/连续行动、多线程 Name Refactored [1] Recurrent Box Discrete Multi Processing A2C ✔️ ✔️ ✔️ ✔️ ✔️ ACER ✔️ ✔️ ❌ [4] ✔️ ✔️ ACKTR ✔️ ✔️ ❌ [