Globally-Robust Neural Networks

MTandHJ

于 2021-07-22 18:40:27 发布

阅读量236

点赞数 1

分类专栏： neural networks

本文链接：https://blog.csdn.net/MTandHJ/article/details/119006454

版权

neural networks 专栏收录该内容

143 篇文章 6 订阅

订阅专栏

文章目录

Leino K., Wang Z. and Fredrikson M. Globally-robust neural networks. In International Conference on Machine Learning (ICML), 2021.

概

本文是一种可验证的鲁棒方法, 并且提出了一种globally-robust的概念, 但是实际看下来并不觉得有特别出彩的地方.

主要内容

对于网络 $\mathbb{R}^{n} \rightarrow \mathbb{R}^{m}$ , 其中 $m$ 表示共有m个不同的类别. 则prediction可以表示为
$\mathop{\arg \max} \limits_{i} f_i(x).$

普通的local robustness采用如下方式定义:

$F$ 被称为在点 $x$ 满足 $\epsilon$ -locally-robust, 当对于任意的样本 $x^{'}$ 满足
$\|x'-x\| \Rightarrow F(x) = F(x').$

这种定义方式并不恰当, 因为倘若这个性质对于所有的点都成立, 那么所有的样本都会被判定为同一个类别, 从而得到的是一个退化的 $F$ .

作者给出的globally-robust的定义是可以对于所有 $x$ 有效的.
首先假设一个新的类别 $\perp$ , 以及关系
$c_1 \mathop{=}\limits^{\perp} c_2,$
当且仅当
$c_1 = c_2 | c_1=\perp | c_2 = \perp .$

则globally-robust是这么定义的:
$F$ 是 $\epsilon$ -globally-robust的, 如果对于任意的 $x_1, x_2$ , 有下列推论成立
$\|x_1 - x_2\| \le \epsilon \Rightarrow F(x_1) \mathop{=}\limits^{\perp} F(x_2).$

换言之, $F$ 关于所有点的预测, 要么其是locally-robust, 要么是属于 $\perp$ 的, 故可以将 $\perp$ 理解为所有不满足locally-robust的点.

接下来作者给出了这样模型的构造方法:
假设
$\frac{|f_i(x_1) - f_i(x_2)|}{\|x_1 - x_2\|} \le K_i, i=1,2,\cdots, m,$
即 $f_i$ 的全局Lipschitz常数为 $K_i$ .
令
$y_i = f_i(x), j=F(x),$
定义
$y_{\perp} = \max_{i\not= j} \{y_i + (K_i + K_j) \epsilon \}.$
背后的直觉是, 根据Lipschitz常数的性质, 有
$y_i -K_i \epsilon \le f_i (x') \le y_i + K_i \epsilon, \\ y_j -K_j \epsilon \le f_j (x') \le y_j + K_j \epsilon,$
所以
$f_i(x') - f_j(x') \le y_i + (K_i + K_j) \epsilon -y_j = y_{\perp} - y_j.$
所以 $y_{\perp}$ 反映了最坏的情况, 如果 $y_{\perp} > y_j$ , 便有可能存在 $\|x'-x\| \le \epsilon$ , 但是 $\not= F(x)$ .
当然了, 这个是一个非常宽泛的情况.
进一步定义:
$\bar{f}_i^{\epsilon} (x) = f_i(x), i =1,2,\cdots, m, \\ \bar{f}_{\perp}^{\epsilon}(x) = y_{\perp},$
所以最后的模型是:
$\bar{F}^{\epsilon}(x) = \mathop{\arg \max} \limits_{i, \perp} \bar{f}_{*}^{\epsilon}(x).$

并由如下的性质:

定理1: 如果 $\bar{F}^{\epsilon}(x) \not = \perp$ , 则 $\bar{F}^{\epsilon}(x) = F(x)$ , 且 $\bar{F}^{\epsilon}$ 在 $x$ 处是 $\epsilon$ -locally-robust的.

这是显然的, 因为这说明在 $\epsilon$ 的ball内, 找出比上面情况更坏的点.

定理2: $\bar{F}^{\epsilon / 2}(x)$ 是 $\epsilon$ -globally-robust的.

只需证明不可能存在 $x_1, x_2, \|x_1 - x_2\| \le \epsilon$ , $\bar{F}^{\epsilon/2}(x_1)=c_1\not= c_2 =\bar{F}^{\epsilon/2}(x_1)$ ,
根据上面的定理可知:
$F(x_1) = c_1 \not = c_2 = F(x_2).$
任取
$x_3 \in B(x_1, \epsilon /2) \cap B(x_2, \epsilon /2),$
注: 这里 $B$ 是闭球.
则根据定理1有 $F(x_1) = F(x_3) = F(x_2)$ , 矛盾.

所以, 我们这么构造的模型就符合作者的定义了, 但是还存在下面的问题:

全局Lipschitz常数的估计问题: 作者采用简单粗暴的逐层计算并相乘, 放得很宽;
如果Lipschitz常数过大, 这个模型并不会有效, 显然所有的样本都会被判断为 $\perp$ , 作者最后采用的损失函数是TRADES的一个变种:
$\mathcal{L}_T(x,y) = \mathcal{L}_{CE}(f(x), y) + \lambda \cdot \mathrm{D}_{KL}(\bar{f}^{\epsilon}(x)\| f(x)).$

代码

原文代码

MTandHJ

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
6
评论
Globally-Robust Neural Networks

文章目录概主要内容代码Leino K., Wang Z. and Fredrikson M. Globally-robust neural networks. In International Conference on Machine Learning (ICML), 2021.概本文是一种可验证的鲁棒方法, 并且提出了一种globally-robust的概念, 但是实际看下来并不觉得有特别出彩的地方.主要内容对于网络f:Rn→Rmf : \mathbb{R}^{n} \rightarrow
复制链接

扫一扫

专栏目录