最近刚入手强化学习代码,但是其中的step()函数,以为是会输出一个二维的坐标值,但是实际上不是,它输出的维数和agent数量还有landmark数值有关,话不多说,上图。求路过的大神指点
强化学习提问
最新推荐文章于 2024-07-26 08:00:00 发布
最近刚入手强化学习代码,但是其中的step()函数,以为是会输出一个二维的坐标值,但是实际上不是,它输出的维数和agent数量还有landmark数值有关,话不多说,上图。求路过的大神指点