【阅读笔记】Formal Verification of Intelligent Hybrid Systems that are Modeled with Simulink and the Reinf

【论文阅读】Formal Verification of Intelligent Hybrid Systems that are Modeled with Simulink and the Reinforcement Learning Toolbox
FM 2021: Formal Methods pp 349-366
在这里插入图片描述

同一批作者另一篇发表在International Conference on Formal Engineering Methods
ICFEM 2018

摘要

强化学习(RL)是一种在动态和不确定环境下控制自主混合系统(HSs)的强大技术,但很难保证其在安全关键应用中的正确行为。为了正式保证安全行为,需要一个形式化系统描述,这在工业设计过程中通常是不可用的,而且在RL的不可预测、试错学习过程中难以获得。
本文提出了一种在 Simulink 中与 RL Toolbox 一起建模的具有嵌入式 RL 组件的智能 HS 的半自动演绎验证方法。
关键思想:

  • 首先,以差分动态逻辑的方式捕获具有混合契约的RL组件的安全相关行为。
  • 其次,利用交互定理证明器KeYmaeraX演绎地验证了被RL组件取代的整个系统的安全特性。为了使这成为可能,通过将现有的从 Simulink 转换扩展到差分动态逻辑以支持 RL 组件来精确捕获工业设计的智能 HS 的语义。
  • 第三,通过从混合合约中自动派生运行时监视器(automatically deriving runtime monitors from our hybrid contracts.) 来确保合约在运行时得到遵守。 通过在工厂环境中验证自主智能机器人的碰撞自由来证明方法的实际适用性、可扩展性和灵活性。

背景

混成系统:混合系统(HSs)结合了离散的和连续的行为。在工业中已经广泛使用MATLAB Simulink来对HS进行建模,以处理它的复杂性。
强化学习:RL是一类机器学习技术,其中代理通过与环境的交互获得经验来学习行为策略。它允许学习适应性强的智能控制器,通常能够优于手动设计的控制器。然而,RL组件通常在试错方法中学习,因此它们本身是不安全

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值