python迷宫通用模板_【强化学习】python 实现 q-learning 迷宫通用模板

最新推荐文章于 2024-02-19 08:47:40 发布

dear Amy

最新推荐文章于 2024-02-19 08:47:40 发布

阅读量234

点赞数

文章标签： python迷宫通用模板

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33788424/article/details/112891200

版权

本文介绍了一个使用Python实现的Q-Learning算法解决6x6迷宫问题的通用模板。通过创建GUI环境模拟迷宫，利用Q-Learning策略让智能体学习并走出迷宫。代码中详细定义了环境类`Maze`和智能体类`Agent`，包括状态、动作、奖励和Q-table的更新。智能体在学习过程中，逐步优化行动策略，最终能够成功找到出口。

摘要由CSDN通过智能技术生成

importpandas as pdimportrandomimporttimeimportpickleimportpathlibimportosimporttkinter as tk'''6*6 的迷宫：

-------------------------------------------

| 入口 | 陷阱 | | | | |

-------------------------------------------

| | 陷阱 | | | 陷阱 | |

-------------------------------------------

| | 陷阱 | | 陷阱 | | |

-------------------------------------------

| | 陷阱 | | 陷阱 | | |

-------------------------------------------

| | 陷阱 | | 陷阱 | 元宝 | |

-------------------------------------------

| | | | 陷阱 | | 出口 |

-------------------------------------------

作者：hhh5460

时间：20181219

地点：Tai Zi Miao'''

classMaze(tk.Tk):'''环境类(GUI)'''UNIT= 40 #pixels

MAZE_R = 6 #grid row

MAZE_C = 6 #grid column

def __init__(self):'''初始化'''super().__init__()

self.title('迷宫')

h= self.MAZE_R *self.UNIT

w= self.MAZE_C *self.UNIT

self.geometry('{0}x{1}'.format(h, w)) #窗口大小

self.canvas = tk.Canvas(self, bg='white', height=h, width=w)#画网格

for c in range(1, self.MAZE_C):

self.canvas.create_line(c* self.UNIT, 0, c *self.UNIT, h)for r in range(1, self.MAZE_R):

self.canvas.create_line(0, r* self.UNIT, w, r *self.UNIT)#画陷阱

self._draw_rect(1, 0, 'black') #在1列、0行处，下同

self._draw_rect(1, 1, 'black')

self._draw_rect(1, 2, 'black')

self._draw_rect(1, 3, 'black')

self._draw_rect(1, 4, 'black')

self._draw_rect(3, 2, 'black')

self._draw_rect(3, 3, 'black')

self._draw_rect(3, 4, 'black')

self._draw_rect(3, 5, 'black')</

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。