论文解读——A Belief State Planner for Interactive Merge Maneuvers in Congested Traffc

Super超星

于 2024-03-08 16:30:32 发布

阅读量1k

点赞数 22

分类专栏：自动驾驶决策规划算法（单车）文章标签：人工智能自动驾驶算法 c++

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_55918181/article/details/136565534

版权

自动驾驶决策规划算法（单车）专栏收录该内容

9 篇文章 3 订阅

订阅专栏

本文详细介绍了如何使用POMDP方法在复杂的交通环境中为自动驾驶车辆设计交互式并道策略，着重于状态空间、动作空间、观察测量以及奖励函数的建模，包括基于IDM模型的车辆动态和Yield分类器的应用。

摘要由CSDN通过智能技术生成

论文解读——A Belief State Planner for Interactive Merge Maneuvers in Congested Traffc

参考资料来源：《A Belief State Planner for Interactive Merge Maneuvers in Congested Traffc》一文

注：这篇文章是关于POMDP方法求解在狭窄车道上合并问题，本文重点在于建模过程，求解过程先略过（学会之后考虑补充一手）

1.POMDP描述

在马尔可夫决策过程(MDPP)的基础上，部分可观测马尔可夫决策过程（POMDP）考虑的环境的部分客观性，即智能体不能准确地得到所有的环境状态，例如无人驾驶汽车无法通过环境感知系统直接得到其他汽车的驾驶意图等。部分可观测马尔可夫决策过程可以形式化地表示为一个六元组，其中状态集合、动作集合、状态转移函数和激励函数的定义与马尔可夫决策过程相同，MDP所不具备的观察集合和观察函数用以描述环境状态的部分可观测性。

2.POMDP建模过程

2.1 状态空间

zhu
在这里插入图片描述

状态空间为 $\chi$ ,其中 $\chi_{0}$ 为自动驾驶车辆， $\chi_{K}$ 为相邻车道或者同一车道上的车辆状态
状态空间2

其中 $\chi_{0}$ 依次由纵向位置、横向位置、纵向速度和所属车道构成

状态空间3

$\chi_{K}$ 依次由纵向位置、纵向速度、所属车道和是否Yield构成（其中该文章假设其他车辆不变道，所以其横向位置一直为0，是否Yield由2.7所提出的分类器决定）

2.2 动作空间

自动驾驶车辆：纵向加速度+横向速度
其他车辆：纵向加速度

2.3 转移模型

转移模型

其中 $w_{lane}$ 为车道宽度

2.4 IDM模型

IDM

针对其他车辆运动模型，该文章使用IDM模型生成纵向加速度，与传统的IDM模型相比，后面加一项噪声，表示驾驶员的偏好程度。

2.5 观测量

观测量

没有是否Yield项

2.6 Reward Function设计

奖励函数.

奖励函数设计如上

奖励函数1

$r_{vel}$ 推荐速度项：用偏离推荐速度的程度来衡量

$r_{wrong lane}$ 错误换道项：-600

$r_{end lane}$ 末态项：在最后50m处，-1000~0线性增加
奖励函数2
$r_{center}$ 中心线项：用偏离中心线的程度来衡量

奖励函数4
$r_{act}$ 加速度项：希望加速度小一点

奖励函数5

$r_{coll}$ 碰撞项：碰撞直接给 $- 1000000$

2.7 Yield分类器

是否屈服

根据数据，训练逻辑回归分类器，输入特征向量为如上。和自动驾驶车辆速度，前车速度，间距等因素有关。

关注

22
点赞
踩
27

收藏

觉得还不错? 一键收藏
1
评论
论文解读——A Belief State Planner for Interactive Merge Maneuvers in Congested Traffc

《A Belief State Planner for Interactive Merge Maneuvers in Congested Traffc》一文：这篇文章是关于POMDP方法求解在上合并问题，本文重点在于过程，求解过程先略过（学会之后考虑补充一手）
复制链接

扫一扫

专栏目录

Super超星 CSDN认证博客专家 CSDN认证企业博客

码龄3年

17: 原创

117万+: 周排名

6万+: 总排名

2万+: 访问

: 等级

643: 积分

500: 粉丝

469: 获赞

13: 评论

405: 收藏

私信

关注

热门文章

分类专栏

最新评论

Automated and Cooperative Vehicle Merging at Highway On-Ramps
CSDN-Ada助手: 恭喜您发布了第15篇博客，“Automated and Cooperative Vehicle Merging at Highway On-Ramps”！这篇博文介绍了自动化和协同化的高速公路匝道车辆合流，内容十分有趣和实用。您的持续创作让读者受益匪浅。接下来，我建议您可以探讨一下这种技术在不同交通场景下的应用，比如城市道路、高速公路拥堵情况下等。这样可以让读者更全面地了解这项技术的潜在价值和可能面临的挑战。期待您未来更多精彩的创作！祝您继续取得成功！
数值优化之无约束优化
CSDN-Ada助手: 恭喜作者发布了第16篇博客，探讨了数值优化中的无约束优化问题，内容丰富而深入。希望作者能继续保持创作的热情和耐心，不断提升文章的质量和深度。或许可以考虑拓展更多数值优化相关的主题，比如有约束优化、多目标优化等，以更全面地展现数值优化的魅力。期待您更多精彩的分享！
数值优化——无约束优化
Super超星: 如果我自己写了的话会开源，因为我现在主要看Apollo代码
数值优化——无约束优化
Deeplearning攀登人: 想问下老哥想学习下后续的课程代码会开源吗
论文解读——A Belief State Planner for Interactive Merge Maneuvers in Congested Traffc
CSDN-Ada助手: 恭喜作者撰写了这篇关于交通拥挤中交互式合并机动的论文解读，这是一个非常值得研究的课题。感谢作者对这一领域的深入探索和分析。希望作者在未来的创作中能够继续保持对这一领域的关注，可以考虑从实际案例出发，结合实地调研数据，为读者提供更具体、更深入的内容。期待作者更多的优秀作品！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。