初探强化学习

最新推荐文章于 2024-08-24 07:08:56 发布

V-SLAM

最新推荐文章于 2024-08-24 07:08:56 发布

阅读量584

点赞数

分类专栏：无人驾驶

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43166819/article/details/103539462

版权

无人驾驶专栏收录该内容

1 篇文章 0 订阅

订阅专栏

初探强化学习

强化学习 (Reinforcement Learning)

又称增强学习等，是机器学习的一种，其模式也是让机器人在“训练”中学到“经验”，以实现给定的任务。但不同于监督学习与非监督学习，在强化学习的框架中，我们更侧重通过机器人与环境的交互来学习。通常在监督学习和非监督学习任务中，机器人往往需要通过给定的训练集，辅之以既定的训练目标（如最小化损失函数），通过给定的学习算法来实现这一目标。然而在强化学习中，机器人则是通过其与环境交互得到的奖励进行学习。这个环境可以是虚拟的，也可以是真实的（自动驾驶汽车在真实道路上收集数据）。

-入门看的资源【百度百科】、【博客】&【博客】、以及练手的小算法程序【博客】。
尝试各种可能，使机器人得到奖励或惩罚，选择最奖励值越多，也就是最鼓励他的方案去执行。

应用

应用在很多领域，其中在无人驾驶领域，主要用作决策和导航，比如说：对于道路场景上突然出现的人或动物，十字路口的决策、最优的路线、变道、会车等一系列决策行为，利用特定的数据集训练他就像是纸上谈兵，泛用性差，必须让他亲自实验懂得这些决策技巧。
在slam中，也并不是用不到，对于语义物体级slam，它的一个最核心、最关键的数据关联问题可以使用增强学习来代替深度学习，有待研究。

注意

增强学习虽然有很多优势，但每项技术总有不足之处，它需要尝试各种可能，不断地尝试还可能带来反馈的延迟，容易做“事后诸葛”。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
初探强化学习

初探强化学习强化学习 (Reinforcement Learning)又称增强学习等，是机器学习的一种，其模式也是让机器人在“训练”中学到“经验”，以实现给定的任务。但不同于监督学习与非监督学习，在强化学习的框架中，我们更侧重通过机器人与环境的交互来学习。通常在监督学习和非监督学习任务中，机器人往往需要通过给定的训练集，辅之以既定的训练目标（如最小化损失函数），通过给定的学习算法来实现这一目标...
复制链接

扫一扫

专栏目录

V-SLAM CSDN认证博客专家 CSDN认证企业博客

码龄6年

16: 原创

54万+: 周排名

174万+: 总排名

3万+: 访问

: 等级

462: 积分

11: 粉丝

28: 获赞

13: 评论

135: 收藏

私信

关注

热门文章

分类专栏

最新评论

DSO跑KITTI数据集
Do_nut: 我后来发现是绝对路径写错了，所以找不到cmaera.txt
DSO跑KITTI数据集
Do_nut: 大佬，我也是这个问题，请问您解决了嘛
EAO-SLAM安装
洛詻: 请问博主有没有遇到这个问题 terminate called after throwing an instance of 'cv::Exception' what(): OpenCV(4.5.5) /home/cqyd/opencv/opencv-4.5.5/modules/core/src/matrix.cpp:438: error: (-215:Assertion failed) _step >= minstep in function 'Mat' 已放弃 (核心已转储) 是怎么解决的？
多视投影几何中的消隐点
洛詻: 不是只知道一个消隐点么 p3是通过p4得到的？
DSO跑KITTI数据集
sunshine123S: 博主请问使用DSO跑KITTI数据集的times.txt如何修改，是直接换成帧数还是在时间戳前面加上帧数？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。