基于深度强化学习的路径规划笔记

最新推荐文章于 2024-05-24 16:08:52 发布

Adam婷

最新推荐文章于 2024-05-24 16:08:52 发布

阅读量2.9w

点赞数 39

分类专栏：神经网络机器学习算法 AI程序员深度学习深度强化学习强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41697507/article/details/89502755

版权

AI程序员同时被 3 个专栏收录

166 篇文章 8 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

161 篇文章 8 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

26 篇文章 1 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

MazePathFinder using deep Q Networks

声明：首先感谢知乎周思雨博主；此方法同源借鉴于ICIA一篇强化学习paper，本博主于2019年元月还原了此方法，由于近期在撰写毕业论文，结合本人的理解创作了此篇博客！感兴趣者欢迎随时留言与我讨论
邮箱adamlouisky@gmail.com(1584622065@qq.com)
感谢！

该程序将由几个封锁（由块颜色表示）组成的图像作为输入，起始点由蓝色表示，目的地由绿色表示。它输出一个由输入到输出的可能路径之一组成的图像。下面显示的是程序的输入和输出。
在这里插入图片描述

在这里插入图片描述

输入图像被馈送到由2个conv和2个fc层组成的模型，其输出对应于底部和右侧动作的Q值。代理根据哪个Q值更大而向右或向下移动，并且使用代理的新位置生成的相应新图像再次被馈送到模型。获得输出状态并反馈新图像的过程保持重复直到代理到达到达目的地的终端阶段。

总体思路：

获取image（map）
Agent处理image
Mobile Robot得到向前还是向右的指令
实现

了解本专栏

超级会员免费看

关注

39
点赞
踩
366

收藏

觉得还不错? 一键收藏
打赏
19
评论
基于深度强化学习的路径规划笔记

MazePathFinder using deep Q Networks该程序将由几个封锁（由块颜色表示）组成的图像作为输入，起始点由蓝色表示，目的地由绿色表示。它输出一个由输入到输出的可能路径之一组成的图像。下面显示的是程序的输入和输出。输入图像被馈送到由2个conv和2个fc层组成的模型，其输出对应于底部和右侧动作的Q值。代理根据哪个Q值更大而向右或向下移动，并且使用代理的新位置...
复制链接

扫一扫

专栏目录

评论 19

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Adam婷 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。