强化学习自动驾驶论文阅读（一）

不如春风十里见你

于 2020-06-14 22:30:12 发布

阅读量2.8k

点赞数 4

分类专栏：自动驾驶文章标签：强化学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45042545/article/details/106753096

版权

（一）paper传送门

Guided Policy Search Model-based Reinforcement Learning for Urban Autonomous Driving

（二）背景知识

强化学习（RL）---------------------------《Reinforcement Learning：An Introduction》第二版
Gaussian Mixed Model(GMM) --------- https://www.jianshu.com/p/9708bb0676b2
Dual Gradient Descent(DGD)-----------https://www.jianshu.com/p/e3e672311442
KL-divergence（KL散度）-------------- https://blog.csdn.net/ningyanggege/article/details/87906786
Carla(模拟器)--------------------------------https://carla.readthedocs.io/en/latest/

（三）摘要

本文提出了一种基于模型的强化学习算法：Guided Policy Search (GPS)来学习在复杂、密集的城市环境中自动驾驶。总体思想是：采用基于模型的思想和使用GMM首先对系统动态进行近似，然后用双梯度下降法（DGD）来优化约束的策略优化问题（受制于轨迹变化幅度的限制（

最低0.47元/天解锁文章

不如春风十里见你

关注

4
点赞
踩
30

收藏

觉得还不错? 一键收藏
1
评论
强化学习自动驾驶论文阅读（一）

（一）paper传送门Guided Policy Search Model-based Reinforcement Learning for Urban Autonomous Driving（二）背景知识强化学习（RL）---------------------------《Reinforcement Learning：An Introduction》第二版Gaussian Mixed Model(GMM) --------- https://www.jianshu.com/p/9708bb0676
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。