关于Distributional Smoothing with Virtual Adversarial Training的理解

最新推荐文章于 2024-06-08 10:02:53 发布

kearney1995

最新推荐文章于 2024-06-08 10:02:53 发布

阅读量5.9k

点赞数 4

分类专栏： Adversarial examples 文章标签：对抗样本

本文链接：https://blog.csdn.net/kearney1995/article/details/79970934

版权

Adversarial examples 专栏收录该内容

8 篇文章 13 订阅

订阅专栏

作者受之前Goodfellow的adversarial training的启发，提出了一种叫局部分布性平滑(LDS) 的方法，这是统计模型的一个新的光滑概念，可以用作正则化术语来促进模型分布的平滑。作者将基于LDS的正则化命名为虚拟对抗训练 (VAT)。
下面简单介绍一下LDS：我们先固定模型的参数 $\theta$ ，假设输入空间为 $R^I$ ，输出空间为 $Q$ ，以及一个训练样本集合：

D = {(x^{(n)}, y^{(n)}) | x^{(n)} \in R^{I}, y^{(n)} \in Q, n = 1, \dots, n}

$\begin{equation}\nonumber D = \{(x^{(n)},y^{(n)}) \,|\, x^{(n)} \in R^I,y^{(n)} \in Q,n=1,\dots,n \} \end{equation}$
然后利用数据集

D D $D$ ，通过参数

θ

$\theta$ 去训练模型分布

p(y|x,θ) p ( y | x , θ ) $p(y \,|\, x,\theta)$ 。用

KL[p||q] K L [ p | | q ] $KL[p||q]$ 表示分布

p p $p$ 和分布

q

$q$ 的KL-散度。同时，我们定义：

Δ K L (r, x (n), θ) r (n) v - a d v = K L [p (y | x (n), θ) | | p (y | x (n) + r, θ)] = arg max r {Δ K L (r, x (n), θ); | | r | | \leq ϵ}

$\begin{equation}\nonumber \begin{aligned} \Delta_{KL}(r,x^{(n)},\theta) &= KL[p(y \,|\, x^{(n)},\theta) || p(y \,|\, x^{(n)}+r,\theta)] \\ r_{v-adv}^{(n)} &= \arg\max_{r} \{\Delta_{KL} (r,x^{(n)},\theta);||r||\leq \epsilon\} \end{aligned} \end{equation}$
我们记

r(n)v−adv r v − a d v ( n ) $r^{(n)}_{v-adv}$ 为第

n n $n$ 的样本的模拟对抗扰动。因此模型分布在

x^{(n)}

$x^{(n)}$ 处的局部分布平滑为：

L D S (x (n), θ) = - Δ K L (r (n) v - a d v, x (n), θ)

$\begin{equation}\nonumber LDS(x^{(n)},\theta) = -\Delta_{KL}(r_{v-adv}^{(n)},x^{(n)},\theta) \end{equation}$
因此，

r(n)v−adv r v − a d v ( n ) $r^{(n)}_{v-adv}$ 实际上是模型分布

p(y|x(n),θ) p ( y | x ( n ) , θ ) $p(y\,|\, x^{(n)},\theta)$ 在KL散度的意义上最为敏感的方向。在某种程度上，这是模型分布相对于输入的梯度

∇x ∇ x $\nabla_x$ 的KL散度近似，并且

x x $x$ 在该方向上的扰动最大程度的破坏了概率分布

p (y | x^{(n)}, θ)

$p(y\,|\,x^{(n)},θ)$ 的局部平滑性。

ΔKL(r(n)v−adv,x(n),θ) Δ K L ( r v − a d v ( n ) , x ( n ) , θ ) $\Delta_{KL}(r_{v-adv}^{(n)},x^{(n)},\theta)$ 的值越小，

p(y|x(n),θ) p ( y | x ( n ) , θ ) $p(y\,|\,x^{(n)},θ)$ 在

x(n) x ( n ) $x^{(n)}$ 处越平滑。我们的目标是在输入样本的邻域提升模型的平滑度，即目标函数（最大化）为：

1 N \sum n = 1 N log p (y (n) | x (n), θ) + λ 1 N \sum n = 1 N L D S (x (n), θ)

$\begin{equation}\nonumber {1 \over N}\sum_{n=1}^N \log p(y^{(n)} \,|\, x^{(n)},\theta) + \lambda {1 \over N} \sum_{n=1}^N LDS(x^{(n)},\theta) \end{equation}$
如果我们定义

r(n)adv=argminr{p(y(n)|x(n)+r,θ),||r||p≤ϵ} r a d v ( n ) = arg ⁡ min r { p ( y ( n ) | x ( n ) + r , θ ) , | | r | | p ≤ ϵ } $r^{(n)}_{adv} =\arg\min_r \{p(y^{(n)} \,|\, x^{(n)}+r,\theta),||r||_p \leq \epsilon \}$ ，并且用

log(y(n)|x(n)+r(n)adv,θ) log ⁡ ( y ( n ) | x ( n ) + r a d v ( n ) , θ ) $\log(y^{(n)} \,|\, x^{(n)}+r^{(n)}_{adv},\theta)$ 代替

−ΔKL(r(n)v−adv,x(n),θ) − Δ K L ( r v − a d v ( n ) , x ( n ) , θ ) $-\Delta_{KL}(r_{v-adv}^{(n)},x^{(n)},\theta)$ ，那么这就变成了Goodfellow的对抗训练的目标函数。而根据

r(n)adv r a d v ( n ) $r^{(n)}_{adv}$ 生成的对抗样本几乎都能够很大程度的影响目标函数的概率分布，因此这很适用于半监督模型。
举一个例子，对于一个线性回归模型

p(y|x,θ)=(θTx,σ2) p ( y | x , θ ) = N ( θ T x , σ 2 ) $p(y \,|\, x,\theta)=\mathcal{N}(\theta^T x,\sigma^2)$ ，它的LDS为：

L D S (x, θ) = - 1 2 σ 2 ϵ 2 | | θ | | 22

$\begin{equation}\nonumber LDS(x,\theta) = - {1 \over 2 \sigma^2} \epsilon^2 ||\theta||_2^2 \end{equation}$
具体推导如下：

K L [p (y | x (n), θ) | | p (y | x (n) + r, θ)] = \int + \infty - \infty p (y | x (n), θ) p ( y | x ( n ) , θ ) p ( y | x ( n ) + r , θ ) d y = \int + \infty - \infty 1 2 π ‾ ‾ ‾ \sqrt σ e - ( y - θ T x ) 2 2 σ 2 - ( y - θ T x ) 2 + ( y - θ T x - θ T r ) 2 2 σ 2 d y = \int + \infty - \infty 1 2 π ‾ ‾ ‾ \sqrt σ e - ( y - θ T x ) 2 2 σ 2 - θ T r ( 2 y - 2 θ T x - θ T r ) 2 σ 2 d y = θ T r \int + \infty - \infty 1 2 π ‾ ‾ ‾ \sqrt σ - y σ 2 e - ( y - θ T x ) 2 2 σ 2 d y + θ T r ( 2 θ T x + θ T r ) 2 σ 2 = θ T r \int + \infty - \infty (1 2 π ‾ ‾ ‾ \sqrt σ e - ( y - θ T x ) 2 2 σ 2 - 1 2 π ‾ ‾ ‾ \sqrt σ θ T x σ 2 e - ( y - θ T x ) 2 2 σ 2) d y + θ T r ( 2 θ T x + θ T r ) 2 σ 2 = θ T r (- θ T x σ 2) + θ T r ( 2 θ T x + θ T r ) 2 σ 2 = ( θ T r ) 2 2 σ 2 = | | θ | | 2 2 ϵ 2 2 σ 2

$\begin{equation}\nonumber \begin{aligned} KL[p(y \,|\, x^{(n)},\theta) || p(y \,|\, x^{(n)}+r,\theta)] &= \int_{-\infty}^{+\infty} p(y \,|\, x^{(n)},\theta) {p(y \,|\, x^{(n)},\theta) \over p(y \,|\, x^{(n)}+r,\theta)} dy \\ &= \int_{-\infty}^{+\infty} {1 \over \sqrt{2\pi}\sigma} e^{-{(y-\theta^Tx)^2 \over 2\sigma^2}} -{(y-\theta^Tx)^2+(y-\theta^Tx-\theta^Tr)^2 \over 2\sigma^2} dy \\ &= \int_{-\infty}^{+\infty} {1 \over \sqrt{2\pi}\sigma} e^{-{(y-\theta^Tx)^2 \over 2\sigma^2}} -{\theta^Tr(2y-2\theta^Tx - \theta^Tr) \over 2\sigma^2} dy \\ &= \theta^Tr \int_{-\infty}^{+\infty} {1 \over \sqrt{2\pi} \sigma} - {y \over \sigma^2} e^{-(y-\theta^Tx)^2 \over 2\sigma^2} dy + {\theta^T r(2\theta^Tx+\theta^Tr) \over 2\sigma^2} \\ &= \theta^Tr \int_{-\infty}^{+\infty} \Big({1 \over \sqrt{2\pi} \sigma} e^{-(y-\theta^Tx)^2 \over 2\sigma^2}-{1 \over \sqrt{2\pi} \sigma} {\theta^Tx \over \sigma^2}e^{-(y-\theta^Tx)^2 \over 2\sigma^2} \Big)dy + {\theta^T r(2\theta^Tx+\theta^Tr) \over 2\sigma^2} \\ &= \theta^Tr(- {\theta^Tx \over \sigma^2}) + {\theta^T r(2\theta^Tx+\theta^Tr) \over 2\sigma^2} \\ &= {(\theta^T r)^2 \over 2\sigma^2} = {{||\theta||_2^2 \epsilon^2} \over 2\sigma^2} \end{aligned} \end{equation}$
这和

L2 L 2 $L_2$ 范数的正则化是一样的，但是如果概率模型为

p(y|x,θ)=(θ3Tx,σ2) p ( y | x , θ ) = N ( θ 3 T x , σ 2 ) $p(y \,|\, x,\theta)=\mathcal{N}({\theta^3}^T x,\sigma^2)$ ，那么我们有

LDS(x,θ3)∝−σ2||θ3||22 L D S ( x , θ 3 ) ∝ − σ 2 | | θ 3 | | 2 2 $LDS(x,\theta^3) \propto - \sigma^2 ||\theta^3||_2^2$ 。如果对于逻辑回归模型

p(y=1|x,θ)=σ(θTx)=(1+exp(−θTx))−1 p ( y = 1 | x , θ ) = σ ( θ T x ) = ( 1 + exp ⁡ ( − θ T x ) ) − 1 $p(y=1 \,|\, x,\theta) = \sigma(\theta^Tx) = (1+\exp(-\theta^Tx))^{-1}$ ，我们有

L D S (x, θ) ≃ - 1 2 σ (θ T x) (1 - σ (θ T x)) ϵ 2 | | θ | | 22

$\begin{equation}\nonumber LDS(x,\theta) \simeq -{1 \over 2} \sigma(\theta^Tx) \big(1-\sigma(\theta^Tx)\big)\epsilon^2||\theta||_2^2 \end{equation}$
这是对

θTr θ T r $\theta^T r$ 泰勒展开得到的：

K L [p (y | x (n), θ) | | p (y | x (n) + r, θ)] = 1 1 + e - θ x log 1 + e - θ T x - θ T r 1 + e - θ x + 1 1 + e θ x log 1 + e θ T x + θ T r 1 + e θ x = - e - θ T x ( 1 + e - θ x ) 2 θ T r - 1 2 e - θ T x ( 1 + e - θ x ) 3 (θ T r) 2 + e θ T x ( 1 + e θ x ) 2 θ T r + 1 2 e θ T x ( 1 + e θ x ) 3 (θ T r) 2 = 1 2 e - θ T x ( 1 + e - θ T x ) 2 (θ T r) 2 = - 1 2 σ (θ T x) (1 - σ (θ T x)) ϵ 2 | | θ | | 22

$\begin{equation}\nonumber \begin{aligned} KL[p(y \,|\, x^{(n)},\theta) || p(y \,|\, x^{(n)}+r,\theta)] &={1 \over {1+e^{-\theta x}}}\log{{1+e^{-\theta^Tx-\theta^Tr}} \over {1+e^{-\theta x}}} +{1 \over {1+e^{\theta x}}}\log{{1+e^{\theta^Tx+\theta^Tr}} \over {1+e^{\theta x}}} \\ &= -{e^{-\theta^T x} \over (1+e^{-\theta x})^2} \theta^T r -{1\over 2}{e^{-\theta^T x} \over (1+e^{-\theta x})^3} (\theta^T r)^2 + {e^{\theta^T x} \over (1+e^{\theta x})^2} \theta^T r +{1\over 2} {e^{\theta^T x} \over (1+e^{\theta x})^3} (\theta^T r)^2 \\ &= {1 \over 2} {e^{-\theta^T x} \over (1+e^{-\theta^T x})^2} (\theta^T r)^2 \\ &= -{1 \over 2} \sigma(\theta^Tx) \big(1-\sigma(\theta^Tx)\big)\epsilon^2||\theta||_2^2 \end{aligned} \end{equation}$
关于扰动向量的计算，作者也选择泰勒展开近似计算，由于

ΔKL(r,x,θ) Δ K L ( r , x , θ ) $\Delta_{KL}(r,x,\theta)$ 在

r=0 r = 0 $r=0$ 处有最小值

0 0 $0$ ，因此，对于

r

$r$ 的一阶微分也等于

0 0 $0$ ：

\nabla_{r} Δ_{K L} (r, x, θ) |_{r = 0}

$\nabla_r \Delta_{KL}(r,x,\theta)|_{r=0}$ 是

0 0 $0$ 。因此我们选择二阶泰勒展开近似计算：

Δ_{K L} (r, x, θ) ≃ \frac{1}{2} r^{T} H (x, θ) r

$\begin{equation}\nonumber \Delta_{KL}(r,x,\theta) \simeq {1 \over 2} r^T H(x,\theta) r \end{equation}$
其中

H(x,θ) H ( x , θ ) $H(x,\theta)$ 是Hessian矩阵，即

H(x,θ)=∇∇rΔKL(r,x,θ)|r=0 H ( x , θ ) = ∇ ∇ r Δ K L ( r , x , θ ) | r = 0 $H(x,\theta)=\nabla\nabla_r \Delta_{KL}(r,x,\theta)|_{r=0}$ 。在这种近似下，

r(n)v−adv r v − a d v ( n ) $r_{v-adv}^{(n)}$ 作为

H(x,θ) H ( x , θ ) $H(x,\theta)$ 的第一个特征向量

u(x,θ) u ( x , θ ) $u(x,\theta)$ 出现，并且值为

ϵ ϵ $\epsilon$ 。（二次型在单位元上的最大值和最小值分别对应其最大特征值和最小特征值，此时

r r $r$ 等于其对应的特征向量，这个具体的证明将Hermite矩阵正交对角化）。因此

r_{v - a d v}^{(n)}

$r_{v-adv}^{(n)}$ 可以近似求解为：

r v - a d v (x, θ) ≃ arg max r {r T H (x, θ) r; | | r | | 2 \leq ϵ} = ϵ u (x, θ) ⎯ ⎯ ⎯ ⎯ ⎯ ⎯ ⎯ ⎯ ⎯ ⎯ ⎯ ⎯ ⎯ ⎯ ⎯

$\begin{equation}\nonumber \begin{aligned} r_{v-adv}(x,\theta) &\simeq \arg\max_{r} \{r^TH(x,\theta)r; ||r||_2 \leq \epsilon\} \\ &= \epsilon \overline{u(x,\theta)} \end{aligned} \end{equation}$
其中

⋅⎯⎯ ⋅ ¯ $\overline{\cdot}$ 表示的是将任意一个非零向量

v v $v$ 投影为其方向向量对应的单位向量

\bar{v}

$\overline{v}$ 。
然而特征值计算是一个

O(n3) O ( n 3 ) $O(n^3)$ 计算复杂度的过程，因此作者提出用幂迭代法(power iteration method)和有限差分法(finite difference method)来计算

rv−adv r v − a d v $r_{v-adv}$ 。设

d d $d$ 是一个随机抽样的单位矢量。只要

d

$d$ 不与主特征向量

u u $u$ 垂直，则迭代计算

d \leftarrow \bar{H d}

$\begin{equation}\nonumber d \leftarrow \overline{Hd} \end{equation}$
会使

d d $d$ 收敛于

u

$u$ 。此外，我们不需要直接计算

H H $H$ ，而是近似为有限差分

\begin{aligned} H d & ≃ \frac{\nabla_{r} Δ_{K L} (r, x, θ) |_{r = ϵ d} - \nabla_{r} Δ_{K L} (r, x, θ) |_{r = 0}}{ξ} \\ = \frac{\nabla_{r} Δ_{K L} (r, x, θ) |_{r = ϵ d}}{ξ} \end{aligned}

$\begin{equation}\nonumber \begin{aligned} Hd &\simeq {\nabla_r \Delta_{KL}(r,x,\theta)|_{r=\epsilon d} -\nabla_r \Delta_{KL}(r,x,\theta)|_{r=0} \over \xi} \\ &={\nabla_r \Delta_{KL}(r,x,\theta)|_{r=\epsilon d} \over \xi} \end{aligned} \end{equation}$
这里我们再次利用了

∇rΔKL(r,x,θ)|r=0=0 ∇ r Δ K L ( r , x , θ ) | r = 0 = 0 $\nabla_r \Delta_{KL}(r,x,\theta)|_{r=0}=0$ ，因此我们就得到了

d d $d$ 的更新公式：

d \leftarrow \bar{\nabla_{r} Δ_{K L} (r, x, θ) |_{r = ϵ d}}

$\begin{equation}\nonumber d \leftarrow \overline{\nabla_r \Delta_{KL}(r,x,\theta)|_{r=\epsilon d}} \end{equation}$
具体的实验，评估就省略了，我们主要用这种方式来生成对抗样本，也能产生很好的效果。

kearney1995

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
关于Distributional Smoothing with Virtual Adversarial Training的理解

作者受之前Goodfellow的adversarial training的启发，提出了一种叫局部分布性平滑(LDS) 的方法，这是统计模型的一个新的光滑概念，可以用作正则化术语来促进模型分布的平滑。作者将基于LDS的正则化命名为虚拟对抗训练 (VAT)。下面简单介绍一下LDS：我们先固定模型的参数θθ\theta，假设输入空间为RIRIR^I，输出空间为QQQ，以及一个训练样本集合： D...
复制链接

扫一扫