Deep Reinforcement Learning （paper reading notes）

最新推荐文章于 2020-03-30 18:13:31 发布

adayiru

最新推荐文章于 2020-03-30 18:13:31 发布

阅读量279

点赞数

分类专栏：学习笔记文章标签： DRLearning

本文链接：https://blog.csdn.net/ada_dc/article/details/79266611

版权

学习笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

                    
                        
                    
                    1.Application of Deep Reinforcement Learning in Mobie Robot Path Planning 
传统RL方法依赖于人工提取特征，本文在强化学习的基础上加入深度Q网络（a Deep Q Network）。通过深度Q网络训练状态函数，并输出每个动作相对应的Q。 
深度Q网络模型：
 状态：从环境中采集的原始RGB图像。
 动作：机器人可能的移动，即前后左右。
 
a Deep Q Network(DQN):
 融合深度学习和强化学习。
 深度学习:负责表示马尔科夫决策过程的状态。
 强化学习:负责把控学习方向。
 DQN 算法的主要做法是 Experience Replay(经验回放机制)，其将系统探索环境得到的数据储存起来，然后随机采样样本更新深度神经网络的参数。
 
Q-Learning:
 reward值矩阵R，矩阵Q，状态s（图节点），行为a（图中边）。
 随机选取状态s和行为a，使用矩阵R，更新矩阵Q。多次计算，最终得到矩阵Q，根据Q即可计算最优路径。![h](https://pic2.zhimg.com/80/e6905f69595ed51e9a406a47603d49ef_hd.jpg) 

                

adayiru

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Deep Reinforcement Learning （paper reading notes）

1.Application of Deep Reinforcement Learning in Mobie Robot Path Planning 传统RL方法依赖于人工提取特征，本文在强化学习的基础上加入深度Q网络（a Deep Q Network）。通过深度Q网络训练状态函数，并输出每个动作相对应的Q。深度Q网络模型：状态：从环境中采集的原始RG
复制链接

扫一扫

专栏目录