发现一个深坑。
mujoco-py这个库最新版是2.0版,需要的是mujoco200。然而如果你安装pip install gym[mujoco]
的话会发现它要求mujoco-py的版本小于2。
在一个issue里看到这是因为人们发现Ant-v3和Humanoid-v3在mujoco2的情况下给出的observation里的接触力(contact force)永远是0。而在mujoco1.5里则是正常的,有时候不是0。
所以后来gym强制要求用户downgrade到1.5的mujoco-py。
下图是mujoco2.0中Ant-v3采样的obs的结果。我试了20次,obs后面部分全部一直都是0。
下图是mujoco150的结果。试了20次里面有一定几率会出现非0的contact force。
我在安装mujoco-py老版的时候,直接pip install mujoco-py&#