周周转转,又是复现这个,之前很多因素放弃了一段时间,现在还是差一点问题。
目前可以通过训练来获得模型参数,但是发觉存在问题:
1、周围没有障碍进行阻挡,可以在环境模型添加周围墙体,增快训练速度。
2、遇到障碍物就停止这个逻辑有点问题。我们需要的是到达目的地的效率会高,通过设置最大步长,惩罚,来给小车设置轮回终止信号。
一、通过GYM或者pyglet搭建一个环境吧。
周周转转,又是复现这个,之前很多因素放弃了一段时间,现在还是差一点问题。
目前可以通过训练来获得模型参数,但是发觉存在问题:
1、周围没有障碍进行阻挡,可以在环境模型添加周围墙体,增快训练速度。
2、遇到障碍物就停止这个逻辑有点问题。我们需要的是到达目的地的效率会高,通过设置最大步长,惩罚,来给小车设置轮回终止信号。
一、通过GYM或者pyglet搭建一个环境吧。