黄色的是宝藏,走到就会得到reward=1
黑色是黑洞,走到就会reward=-1
maz_env.py是整个迷宫环境的程序,用的tkinter
代码见https://github.com/skyerhxx/Q-learning-maze
项目结构
参考借鉴:
莫烦python
黄色的是宝藏,走到就会得到reward=1
黑色是黑洞,走到就会reward=-1
maz_env.py是整个迷宫环境的程序,用的tkinter
代码见https://github.com/skyerhxx/Q-learning-maze
项目结构
参考借鉴:
莫烦python