苏涛:对抗样本技术在互联网安全领域的应用

file


导读: 验证码作为网络安全的第一道屏障,其重要程度不言而喻。当前,卷积神经网络的高速发展使得许多验证码的安全性大大降低,一些新型验证码甚至选择牺牲可用性从而保证安全性。针对对抗样本技术的研究,给验证码领域带来了新的契机,并已应用于验证码反识别当中,为这场旷日持久攻防对抗注入了新的活力。

分享内容包括三大方面:

  • 对抗样本介绍
  • 极验对抗样本技术探索与应用
  • 后续的工作与思考
  • -

01 对抗样本介绍

1. 什么是对抗样本

file

对抗样本 ( Adversarial Examples ) 的概念最早是 Christian Szegedy(克里斯蒂安·塞格迪)在 ICLR2014 (国际学习表征会议)上提出来的,即在数据集中通过故意添加细微的非随机的干扰所形成输入样本,受干扰之后的输入导致模型以高置信度给出了一个错误的输出。

如上图(左)原始图像以57%的置信度判断为“熊猫”,但是加入了微小的干扰之后,在人眼完全看不出差别的情况下,模型却以99%的置信度输出“长臂猿”。

当然,对抗样本不仅仅会出现在图片上,语音、文本上也会出现对抗样本,一段语音上加入微不可察的背景音,可以让语音识别模型输出错误的语音内容;在一段文本上使用近义词替换,也可以构造出对抗样本,误导语言模型。

那么为什么深度神经网络会出现对抗样本呢?

目前获得普遍认可的15年古德菲洛的观点,是深度神经网络的高维线性性导致了对抗样本的出现。

直观的理解,在进行一个高维度的线性运算时,每个维度都做一些微小的改动,会使输出结果发生巨大的变化。如上图,原始的输入是x,线性运算的权重是w,此时将样本分类到类别1的概率是5%,但是我们将输入的每一个维度都改变0.5,此时将样本分类到类别1的概率就变成了88%。

以上是对抗样本的一些简单的定义和目前比较被广泛认可的原因。

2. 为什么需要对抗样本

file

自从2012年AlexNet诞生以来,深度神经网络迎来了一段爆发式发展,并且广泛地应用于自动驾驶、医疗、金融、安防等领域。可以说深度神经网络模型已经深入我们生活的方方面面。对抗样本对这些模型的威胁是一个客观存在的事实,如果将STOP交通指示牌上加上一些微小的扰动,就会被检测模型识别为减速。行人穿上带有训练好的马赛克图案的衣服,就能在智能监控模型的视线中“隐

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
gan对抗样本代码是指用生成对抗网络(GAN)生成对抗样本的实现代码。 GAN是一种机器学习模型,由生成器和判别器组成,能够生成逼真的图像和数据。GAN对抗样本指的是通过对抗学习的方式,生成与原始训练样本相似但能够对抗分类模型的样本。 实现GAN对抗样本的代码通常可以分为以下几个步骤: 1. 数据准备:首先需要准备原始的训练数据集,该数据集包含了各类别的正样本。 2. GAN模型搭建:根据具体的需求,搭建生成器和判别器的网络结构。生成器通常使用反卷积网络,判别器使用卷积网络。可以使用深度学习框架如TensorFlow或PyTorch来创建模型。 3. 训练GAN模型:使用原始数据集对GAN模型进行训练。训练的目标是使生成器生成的样本尽可能接近真实样本,而判别器能够准确区分真实样本和生成样本。训练过程中,需要分别更新生成器和判别器的参数。 4. 生成对抗样本:在训练好的GAN模型中,可以使用生成器来生成对抗样本。输入一些噪声或随机向量作为输入,生成器将生成与原始样本相似但对抗分类器的样本。 5. 对抗样本测试和攻击:生成的对抗样本可以用于测试和攻击分类模型。将对抗样本输入到分类模型中,观察其分类结果。对抗样本测试的目的是为了评估分类模型对对抗样本的鲁棒性。 以上是关于GAN对抗样本代码的基本流程。根据实际需求和具体的数据集,代码实现可能会有所差异,但以上步骤是大致的框架。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值