用python写一个简单入门的强化学习网络，下面是一个走迷宫的小案例，简单用open加txt文档存储训练数据，再提取出来在用tkinter搭建网络图形界面演示训练结果，对于初学者理解很有助力

ppttyu

于 2023-12-13 16:29:17 发布

阅读量395

点赞数 9

文章标签： python 算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ppttyu/article/details/134975408

版权

本文通过一个简单的Python强化学习网络示例，演示如何使用Q学习算法解决走迷宫问题。利用numpy初始化Q表，根据策略选择行动，更新Q表。训练数据存储在txt文档中，用tkinter展示训练结果，帮助初学者理解强化学习。

摘要由CSDN通过智能技术生成

import numpy as np

import random

import copy

import time,re

Qtable=np.zeros((6,6,4))

at=["up","down","left","right"]

at1=[0,1,2,3]

cc=dict(zip(at,at1))

def choice(s,qt):

if random.random()<0.7:

a=random.choice(at)

else:

a=np.argmax(qt[s[0],s[1],:])

a=at[a]

return a

def next(s,a):

s1=copy.deepcopy(s)

if a=="up":

if s[0]==0:

s1=s

else:s1[0]=s[0]-1

elif a=="down":

if s[0]==5:

s1=s

else:s1[0]=s[0]+1

elif a=="left":

if s[1]==0:

s1=s

else:s1[1]=s[1]-1

else:

if s[1]==5:

s1=s

else:s1[1]=s[1]+1

if s1==[5,5]:

r=1

elif s1==[2,2] or s1==[2,4] or s1==[3,1]:

r=-1

else:r=0

return s1,r

#z=next([3,3],"left")

#print(z)

def f(qt):

最低0.47元/天解锁文章

关注

9
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

ppttyu CSDN认证博客专家 CSDN认证企业博客

码龄3年

3: 原创

165万+: 周排名

31万+: 总排名

1158: 访问

: 等级

53: 积分

20: 粉丝

23: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

最新评论

用python写一个简单入门的强化学习网络，下面是一个走迷宫的小案例，简单用open加txt文档存储训练数据，再提取出来在用tkinter搭建网络图形界面演示训练结果，对于初学者理解很有助力
CSDN-Ada助手: 恭喜你写了第三篇博客！标题听起来非常有吸引力，用Python写一个简单入门的强化学习网络，再结合一个走迷宫的小案例，真是很有趣的主题。你的博客内容对初学者来说一定非常有帮助，能够帮助他们理解强化学习的基础知识。我很喜欢你使用open加txt文档存储训练数据的方式，这种简单而直接的方法对于初学者来说非常友好。而且，你还提到了使用tkinter搭建网络图形界面来演示训练结果，这无疑增加了学习的趣味性。继续保持创作的劲头，我期待你的下一篇博客。如果我可以提供一些建议的话，我建议你可以探索更多关于强化学习的高级主题，例如深度强化学习或者多智能体强化学习。这样可以帮助读者更深入地了解和应用强化学习的技术。再次祝贺你的创作成果，希望你在未来的写作中不断进步！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
用numpy纯手工搭建神经网络，
CSDN-Ada助手: 恭喜你开始了博客创作！搭建神经网络是一个很有挑战性的话题，能看到你用numpy纯手工搭建神经网络的分享，非常值得学习借鉴。希望你在接下来的创作中，可以更深入地探讨神经网络的原理和应用，或者分享一些实践经验和案例分析，这样可以让读者更全面地了解这个话题。加油！期待你更多的精彩内容。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
用pygame简单写的代码，主要研究一下触屏滑动控制小球，用MOUSEMOTION简单写个逻辑代码就能实现，感兴趣的小伙伴可以看一下
CSDN-Ada助手: 非常棒的博文！很高兴看到你使用pygame编写了这样一个有趣的小球控制代码。你的摘要中提到了一些关于设置颜色和位置的代码，这对于初学者来说非常有帮助。我鼓励你继续创作，分享更多关于pygame的知识和经验。除了你已经提到的内容，还有一些扩展知识和技能与你的博文相关。例如，你可以介绍如何使用pygame的事件处理机制来实现更复杂的交互操作，比如点击、拖动等。另外，你还可以分享如何利用pygame的碰撞检测功能来实现小球与其他物体的互动效果。这些都是与你博文主题相关且有趣的扩展内容。期待看到你更多精彩的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。