【强化学习】深入浅出强化学习--机器人找金币
首先自定义环境,自定义的环境将继承gym.env环境。在初始化的时候,可以指定环境支持的渲染模式(例如human,rgb_array,ansi)以及渲染环境的帧速率。当没有初始化的时候都有默认的渲染模式,在Grid World中将支持rgb_array和human模式,并以4FPS的速度渲染。环境的__init__方法将接受整数大小,它决定了方形网格的大小。同时将设置一些用于渲染的变量,并定义和。在我们代码中,观测值应该提供有关代理和目标在二维网格上的位置的信息。
原创
2022-11-02 11:02:07 ·
2215 阅读 ·
3 评论