对抗训练及其代码实现

最新推荐文章于 2023-06-10 00:37:05 发布

fly_jx

最新推荐文章于 2023-06-10 00:37:05 发布

阅读量3.7k

点赞数 2

分类专栏：自然语言处理常用方法文章标签：自然语言处理

本文链接：https://blog.csdn.net/weixin_42145837/article/details/123940127

版权

自然语言处理常用方法专栏收录该内容

2 篇文章 0 订阅

订阅专栏

对抗训练及其代码实现

1： fgm

对于输入X， 正常训练得到梯度，然后给X的embeddings加一个扰动获得扰动后的梯度
（扰动根据embedding的梯度计算得来），两个梯度相加更新模型。

代码实现

import torch
class FGM():
    def __init__(self, model):
        self.model = model
        self.backup = {}

    def attack(self, epsilon=1., emb_name='emb.'):
        # emb_name这个参数要换成你模型中embedding的参数名
        for name, param in self.model.named_parameters():
            if param.requires_grad and emb_name in name:
                self.backup[name] = param.data.clone()
                norm = torch.norm(param.grad)
                if norm != 0 and not torch.isnan(norm):
                    r_at = epsilon * param.grad / norm
                    param.data.add_(r_at)

    def restore(self, emb_name='emb.'):
        # emb_name这个参数要换成你模型中embedding的参数名
        for name, param in self.model.named_parameters():
            if param.requires_grad and emb_name in name: 
                assert name in self.backup
                param.data = self.backup[name]
        self.backup = {}

模型中使用

# 初始化
fgm = FGM(model)
for batch_input, batch_label in data:
    # 正常训练
    loss = model(batch_input, batch_label)
    loss.backward() # 反向传播，得到正常的grad
    # 对抗训练
    fgm.attack() # 在embedding上添加对抗扰动
    loss_adv = model(batch_input, batch_label)
    loss_adv.backward() # 反向传播，并在正常的grad基础上，累加对抗训练的梯度
    fgm.restore() # 恢复embedding参数
    # 梯度下降，更新参数
    optimizer.step()
    model.zero_grad()

2： PGD

对于每个x:
  	1.计算x的前向loss、反向传播得到梯度并备份
	对于每步t:
		2.根据embedding矩阵的梯度计算出r，并加到当前embedding上，相当于x+r(超出范围则投影回epsilon内)
		3.t不是最后一步: 将梯度归0，根据1的x+r计算前后向并得到梯度
		4.t是最后一步: 恢复(1)的梯度，计算最后的x+r并将梯度累加到(1)上
	5.将embedding恢复为(1)时的值
	6.根据(4)的梯度对参数进行更新

代码实现

import torch
class PGD():
    def __init__(self, model):
        self.model = model
        self.emb_backup = {}
        self.grad_backup = {}

    def attack(self, epsilon=1., alpha=0.3, emb_name='emb.', is_first_attack=False):
        # emb_name这个参数要换成你模型中embedding的参数名
        for name, param in self.model.named_parameters():
            if param.requires_grad and emb_name in name:
                if is_first_attack:
                    self.emb_backup[name] = param.data.clone()
                norm = torch.norm(param.grad)
                if norm != 0 and not torch.isnan(norm):
                    r_at = alpha * param.grad / norm
                    param.data.add_(r_at)
                    param.data = self.project(name, param.data, epsilon)

    def restore(self, emb_name='emb.'):
        # emb_name这个参数要换成你模型中embedding的参数名
        for name, param in self.model.named_parameters():
            if param.requires_grad and emb_name in name: 
                assert name in self.emb_backup
                param.data = self.emb_backup[name]
        self.emb_backup = {}

    def project(self, param_name, param_data, epsilon):
        r = param_data - self.emb_backup[param_name]
        if torch.norm(r) > epsilon:
            r = epsilon * r / torch.norm(r)
        return self.emb_backup[param_name] + r

    def backup_grad(self):
        for name, param in self.model.named_parameters():
            if param.requires_grad:
                self.grad_backup[name] = param.grad.clone()

    def restore_grad(self):
        for name, param in self.model.named_parameters():
            if param.requires_grad:
                param.grad = self.grad_backup[name]

使用

pgd = PGD(model)
K = 3
for batch_input, batch_label in data:
    # 正常训练
    loss = model(batch_input, batch_label)
    loss.backward() # 反向传播，得到正常的grad
    pgd.backup_grad()
    # 对抗训练
    for t in range(K): ## 注意注意，对抗扰动是累加的，每次都是在上一次加扰动的基础上再加扰动
        pgd.attack(is_first_attack=(t==0)) # 在embedding上添加对抗扰动, first attack时备份param.data
        if t != K-1:
            model.zero_grad()
        else:
            pgd.restore_grad() ## 只保存最后一次扰动的梯度，来更新模型参数
        loss_adv = model(batch_input, batch_label)
        loss_adv.backward() # 反向传播，并在正常的grad基础上，累加对抗训练的梯度
    pgd.restore() # 恢复embedding参数
    # 梯度下降，更新参数
    optimizer.step()
    model.zero_grad()

代码部分参考自：功守道：NLP中的对抗训练 + PyTorch实现

3 freelb

对于每个输入x:
  		1、通过均匀分布初始化扰动r，初始化梯度g为0，设置步数为K
  		对于每步t=1...K:
    		2、根据x+r计算前向loss和后向梯度g1，累计梯度g=g+g1/k
    		3、更新扰动r，更新方式跟PGD一样
  		4、根据g更新梯度

代码实现

在这里插入代码片

使用

在这里插入代码片

fly_jx

关注

2
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
对抗训练及其代码实现

对抗训练及其代码实现1： fgm对于输入X，正常训练得到梯度，然后给X的embeddings加一个扰动获得扰动后的梯度（扰动根据embedding的梯度计算得来），两个梯度相加更新模型。代码实现import torchclass FGM(): def __init__(self, model): self.model = model self.backup = {} def attack(self, epsilon=1., emb_name=
复制链接

扫一扫