论文阅读笔记-Reachability Analysis for Neural Feedback Systems using Regressive Polynomial Rule Inference

Abstract

本文针对神经网络控制的连续动力系统做可达集的过近似分析来验证其安全属性。具体来说,本文对神经网络控制器做局部多项式逼近,计算严格的误差;对连续微分方程定义的系统进行基于泰勒模型的流构建,将两者结合起来计算得到可达集的过近似

Introduction

首先,简单的将已有的工具组合起来:ODEs的flowpipe构建工具+神经网络的区间分析工具会引入非常大的过近似误差
本文方法形式化的来说:对神经网络控制器,使用回归方法计算输出对输入的多项式表示,然后计算网络和多项式之间的误差区间。其主要的难点就在于计算误差区间,因此,本文使用一种间接的方式:首先对多项式进行带区间分析的分支定界搜索(branch-and-bound search with interval analysis)进行分段线性化(PWL),其中多项式和多段线性之间的误差可以保证在某个给定的 ϵ \epsilon ϵ内。然后,使用混合整形线性规划求解器和局部的梯度下降搜索来计算网络和PWL之间的最大最小误差。最终将两个误差加起来作为网络模型和多项式抽象的误差。

Perliminaries

Definition 2.1 (Continuous Dynamic System,CDS):由ODE定义: x ˙ = f ( x , u , w ) \dot{x}=f(x,u,w) x˙=f(x,u,w)其中 x ∈ R n x \in R^n xRn表示状态变量的向量, u ∈ U u\in U uU表示控制输入, w ∈ W w \in W wW表示一个时变的扰动。

Definition 2.2 (Reachability Problem):CDS的可达性问题有:(a)一个系统的函数定义 f ( x , u , w ) f(x,u,w) f(x,u,w),(b)一个Lipschitz连续的反馈控制 u = g ( x ) u=g(x) u=g(x),©扰动集W,(d)初始集 X 0 X_0 X0,(e)目标集 X f X_f Xf,(f)时间域 [ 0 , T ] [0,T] [0,T]。去验证是否存在一条轨迹,从初始集开始,在 W W W范围内的扰动信号下, [ 0 , T ] [0,T] [0,T]时间内到达目标集 X f X_f Xf

求解该可达性问题对动力系统的安全验证时至关重要的,但非线性连续动力系统的可达性问题时不可判定的,因此,一般的做法就是计算其可达集的过近似,判断其与非安全集不相交。本文建立在泰勒模型上。

Definition 2.3 (Taylor Model, TM):一个TM表示为(p,I)对,其中p代表x上的多项式,其定义域D为一个区间,I代表一个区间。

给定一个函数 f ( x ) f(x) f(x) with x ∈ D x\in D xD,一个TM(p,I)过近似 f f f当且仅当 ∀ z ∈ D , f ( z ) ∈ p ( z ) + I \forall z \in D, f(z) \in p(z)+I zD,f(z)p(z)+I
给定一个ODE x ˙ = f ( x , u , w ) \dot{x} = f(x,u,w) x˙=f(x,u,w),其中 u ( t ) = g ( x , t ) u(t)=g(x,t) u(t)=g(x,t)和一个时间域 [ 0 , T ] [0,T] [0,T]以及积分时间步 τ I \tau_I τI,可以使用TM integrator(如Flow*)来计算一组N个TMs: ( p 0 , I 0 ) , . . . , ( p N − 1 , I N − 1 ) (p_0,I_0),...,(p_{N-1},I_{N-1}) (p0,I0),...,(pN1,IN1),其中 N = ⌈ T τ I ⌉ N=\lceil \frac{T}{\tau_I}\rceil N=τIT,则 ( p j , I j ) (p_j,I_j) (pj,Ij)就是代表了闭循环系统在时间域 [ j τ I , ( j + 1 ) τ I ] [j\tau_I,(j+1)\tau_I] [jτI,(j+1)τI]上的可达集的TM过近似表示。

Range Analysis for Neural Networks.:网络的区间分析的目标就是对一个网络 N N N和一个输入域 x ∈ D x \in D xD,找到一个区间 [ l , u ] [l,u] [l,u],使得 ∀ x ∈ D , F N ( x ) ∈ [ l , u ] \forall x \in D , F_N(x) \in [l,u] xD,FN(x)[l,u],同时使得找到的区间尽可能紧。形式化的,可以表示成两个优化问题:
m a x ( m i n ) y s . t . x ∈ I ∧ y = F N ( x ) max(min) y \quad s.t. x \in I \wedge y=F_N(x) max(min)ys.t.xIy=FN(x).
但是求解这两个优化问题高度非线性,对于ReLU激活函数,可以将其编码成一个很大的混合线性规划问题(MILP),Dutta已有的工作使用梯度信息提高当前的解,实现在工具SherLock中。但这种方法也只能做很小的提升且会陷入局部最优解。

Problem Statement and Approach

Problem Statement

Definition 3.1(Neural Feedback System,DFS).一个DFS表示为一个元组 < X , U , W , f ( x , u , w ) > <X,U,W,f(x,u,w)> <X,U,W,f(x,u,w)>
在这里插入图片描述

Our Approach

给定一个初始集 X 0 X_0 X0和N步的可达集计算任务,生成一个时间域 T = N τ c T=N\tau_c T=Nτ

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值