面向无人驾驶时空同步约束制导的安全强化学习Spatio-Clock Synchronous Constraint Guided Safe Reinforcement Learning for Aut

最新推荐文章于 2023-08-09 15:34:27 发布

daisyxyr

最新推荐文章于 2023-08-09 15:34:27 发布

阅读量189

点赞数

分类专栏：计算机英语文章标签：时空同步约束形式化规约安全强化学习智能交通无人驾驶

本文链接：https://blog.csdn.net/daisyxyr/article/details/125709726

版权

面向无人驾驶时空同步约束制导的安全强化学习
Spatio-Clock Synchronous Constraint Guided Safe Reinforcement Learning for Autonomous Driving

摘要：无人驾驶系统综合了软件和硬件复杂的交互过程，在系统设计阶段，形式化方法可以保证系统满足逻辑规约和安全需求；在系统运行阶段，深度强化学习被广泛应用于无人驾驶系统决策中.然而，在面对没有经验的场景和复杂决策任务时，基于黑盒的深度强化学习系统并不能保证系统的安全性和复杂任务奖励函数设置的可解释性.为此提出了一种形式化时空同步约束制导的安全强化学习方法.首先，提出了一种形式化时空同步约束规约语言，接近自然语言的安全需求规约使奖励函数的设置更具有解释性.其次，展示了时空同步自动机和状态-动作空间迁移系统，保证强化学习的状态行为策略更加安全.然后，提出了结合形式化时空约束制导的安全强化学习方法.最后，通过无人驾驶汽车在高速场景变道超车的案例，验证所提方法的有效性.

关键词: 时空同步约束, 形式化规约, 安全强化学习, 时序差分, 智能交通仿真, 无人驾驶安全

Abstract：Autonomous driving systems integrate complex interactions between hardware and software. In order to ensure the safe and reliable operations, formal methods are used to provide rigorous guarantees to satisfy logical specifications and safety-critical requirements in the design stage. As a widely employed machine learning architecture, deep reinforcemen

最低0.47元/天解锁文章

daisyxyr

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
面向无人驾驶时空同步约束制导的安全强化学习Spatio-Clock Synchronous Constraint Guided Safe Reinforcement Learning for Aut

面向无人驾驶时空同步约束制导的安全强化学习Spatio-Clock Synchronous Constraint Guided Safe Reinforcement Learning for Autonomous Driving摘要：无人驾驶系统综合了软件和硬件复杂的交互过程，在系统设计阶段，形式化方法可以保证系统满足逻辑规约和安全需求；在系统运行阶段，深度强化学习被广泛应用于无人驾驶系统决策中.然而，在面对没有经验的场景和复杂决策任务时，基于黑盒的深度强化学习系统并不能保证系统的安全性和复杂任务奖励函数
复制链接

扫一扫

专栏目录