文章目录
Abstract
本文针对神经网络控制的连续动力系统做可达集的过近似分析来验证其安全属性。具体来说,本文对神经网络控制器做局部多项式逼近,计算严格的误差;对连续微分方程定义的系统进行基于泰勒模型的流构建,将两者结合起来计算得到可达集的过近似
Introduction
首先,简单的将已有的工具组合起来:ODEs的flowpipe构建工具+神经网络的区间分析工具会引入非常大的过近似误差
本文方法形式化的来说:对神经网络控制器,使用回归方法计算输出对输入的多项式表示,然后计算网络和多项式之间的误差区间。其主要的难点就在于计算误差区间,因此,本文使用一种间接的方式:首先对多项式进行带区间分析的分支定界搜索(branch-and-bound search with interval analysis)进行分段线性化(PWL),其中多项式和多段线性之间的误差可以保证在某个给定的 ϵ \epsilon ϵ内。然后,使用混合整形线性规划求解器和局部的梯度下降搜索来计算网络和PWL之间的最大最小误差。最终将两个误差加起来作为网络模型和多项式抽象的误差。
Perliminaries
Definition 2.1 (Continuous Dynamic System,CDS):由ODE定义: x ˙ = f ( x , u , w ) \dot{x}=f(x,u,w) x˙=f(x,u,w)其中 x ∈ R n x \in R^n x∈Rn表示状态变量的向量, u ∈ U u\in U u∈U表示控制输入, w ∈ W w \in W w∈W表示一个时变的扰动。
Definition 2.2 (Reachability Problem):CDS的可达性问题有:(a)一个系统的函数定义 f ( x , u , w ) f(x,u,w) f(x,u,w),(b)一个Lipschitz连续的反馈控制 u = g ( x ) u=g(x) u=g(x),©扰动集W,(d)初始集 X 0 X_0 X0,(e)目标集 X f X_f Xf,(f)时间域 [ 0 , T ] [0,T] [0,T]。去验证是否存在一条轨迹,从初始集开始,在 W W W范围内的扰动信号下, [ 0 , T ] [0,T] [0,T]时间内到达目标集 X f X_f Xf
求解该可达性问题对动力系统的安全验证时至关重要的,但非线性连续动力系统的可达性问题时不可判定的,因此,一般的做法就是计算其可达集的过近似,判断其与非安全集不相交。本文建立在泰勒模型上。
Definition 2.3 (Taylor Model, TM):一个TM表示为(p,I)对,其中p代表x上的多项式,其定义域D为一个区间,I代表一个区间。
给定一个函数 f ( x ) f(x) f(x) with x ∈ D x\in D x∈D,一个TM(p,I)过近似 f f f当且仅当 ∀ z ∈ D , f ( z ) ∈ p ( z ) + I \forall z \in D, f(z) \in p(z)+I ∀z∈D,f(z)∈p(z)+I。
给定一个ODE x ˙ = f ( x , u , w ) \dot{x} = f(x,u,w) x˙=f(x,u,w),其中 u ( t ) = g ( x , t ) u(t)=g(x,t) u(t)=g(x,t)和一个时间域 [ 0 , T ] [0,T] [0,T]以及积分时间步 τ I \tau_I τI,可以使用TM integrator(如Flow*)来计算一组N个TMs: ( p 0 , I 0 ) , . . . , ( p N − 1 , I N − 1 ) (p_0,I_0),...,(p_{N-1},I_{N-1}) (p0,I0),...,(pN−1,IN−1),其中 N = ⌈ T τ I ⌉ N=\lceil \frac{T}{\tau_I}\rceil N=⌈τIT⌉,则 ( p j , I j ) (p_j,I_j) (pj,Ij)就是代表了闭循环系统在时间域 [ j τ I , ( j + 1 ) τ I ] [j\tau_I,(j+1)\tau_I] [jτI,(j+1)τI]上的可达集的TM过近似表示。
Range Analysis for Neural Networks.:网络的区间分析的目标就是对一个网络 N N N和一个输入域 x ∈ D x \in D x∈D,找到一个区间 [ l , u ] [l,u] [l,u],使得 ∀ x ∈ D , F N ( x ) ∈ [ l , u ] \forall x \in D , F_N(x) \in [l,u] ∀x∈D,FN(x)∈[l,u],同时使得找到的区间尽可能紧。形式化的,可以表示成两个优化问题:
m a x ( m i n ) y s . t . x ∈ I ∧ y = F N ( x ) max(min) y \quad s.t. x \in I \wedge y=F_N(x) max(min)ys.t.x∈I∧y=FN(x).
但是求解这两个优化问题高度非线性,对于ReLU激活函数,可以将其编码成一个很大的混合线性规划问题(MILP),Dutta已有的工作使用梯度信息提高当前的解,实现在工具SherLock中。但这种方法也只能做很小的提升且会陷入局部最优解。
Problem Statement and Approach
Problem Statement
Definition 3.1(Neural Feedback System,DFS).一个DFS表示为一个元组 < X , U , W , f ( x , u , w ) > <X,U,W,f(x,u,w)> <X,U,W,f(x,u,w)>
Our Approach
给定一个初始集 X 0 X_0 X0和N步的可达集计算任务,生成一个时间域 T = N τ c T=N\tau_c T=Nτ