对抗防御方法（Adversarial defense method）

小黄要当程序员

于 2024-07-25 16:45:27 发布

阅读量1.3k

点赞数 21

分类专栏：论文精读文章标签：人工智能机器学习卷积神经网络神经网络

本文链接：https://blog.csdn.net/a2333333_/article/details/140692810

版权

简介

本文基于文章A Review of Adversarial Attack and Defense for Classification Methods的总结，提供对抗领域的几种常见的防御方法

攻击方法见：对抗攻击方法(Adversarial attack method)

防御方法大体分为四大类：(1)对抗训练(2)引入随机因素(3)用投影去除对抗性扰动，(4)检测对抗性示例而不是正确分类它们。

一、对抗训练（Adversarial Training）

非常经典的提高鲁棒性的方法

对抗训练致力于解决以下问题：

$\min_{\theta}\max_{\delta\in S}L(\theta,x+\delta,y)$

这是一个经典的最大最小问题，最大化损失用于创建对抗样本，而最小化则用于使得分类器正确分类对抗样本

介绍一种非常经典的对抗训练方式TRADES（Theoretically Principled Trade-off between Robustness and Accuracy）

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小黄要当程序员

关注关注

21
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

人工智能-机器学习：对抗攻击与防御(Adversarial Attack and Defense)

u013250861的博客

11-29

7204

什么是对抗攻击与防御(Adversarial Attack and Defense) - 在实际的机器学期分类器中，更多的情况是用在实际生活中，很多时候实际系统会遇到很多的干扰、甚至是人为的蓄意攻击。如垃圾邮件等，我们需要让机器判别这些恶意攻击。 - 机器训练出来的模型不光性能要强，还要能够对抗人类的恶意、攻击。 - 现阶段，各种机器学习的模型很容易被攻击，但是不容易防御。 # 二、对抗攻击(Adversarial Attack) ## 1、对抗攻击(Adversarial Attack)的分类

对抗样本 (Adversarial Examples) 原理与代码实例讲解

最新发布

AGI×大数据，开启智能时代的认知跃迁；解码AGI，赋能数据驱动的智能革命。

08-18

140

对抗样本 (Adversarial Examples) 原理与代码实例讲解作者：禅与计算机程序设计艺术 / Zen and the Art of Computer Programming 1. 背景介绍 1

参与评论您还未登录，请先登录后发表或查看评论

深度学习入门教学——对抗攻击和防御

计算机硕士的博客

09-25

849

对抗样本、对抗攻击、对抗防御的简单概述。

基于图的对抗式攻击和防御（Adversarial attacks and defenses on graphs）.pdf

03-05

在这篇综述中，我们对目前的攻击和防御进行了分类，以及回顾了相关表现优异的模型。最后，我们开发了一个具有代表性算法的知识库，该知识库可以使我们进行相关的研究来加深我们对基于图的攻击和防御的理解。

对抗攻击和防御

白景屹的博客

10-27

4313

目录对抗攻击防御References 对抗攻击在计算机视觉任务中可能存在以下现象，对输入样本故意添加一些人类无法察觉的细微干扰，将会导致模型以高置信度输出一个错误的分类结果，这被称为对抗攻击。对抗攻击的目标是使模型错误分类样本，同时不能过度修改样本。对抗攻击通常分为白盒攻击和黑盒攻击。对于白盒攻击，攻击者已知模型内部的所有信息和参数，基于给定模型的梯度生成对抗样本，对网络进行攻击。对于黑盒攻击，攻击者不了解模型的参数和结构信息，仅通过模型的输入和输出，生成对抗样本，再对网络进行攻击。黑盒攻击和白盒攻击的思

6 15种对抗攻击的防御方法

weixin_30736301的博客

07-31

2011

目前，在对抗攻击防御上存在三个主要方向： 1）在学习过程中修改训练过程或者修改的输入样本。 2）修改网络，比如：添加更多层/子网络、改变损失/激活函数等。 3）当分类未见过的样本时，用外部模型作为附加网络。第一个方法没有直接处理学习模型。另一方面，另外两个分类是更加关心神经网络本身的。这些方法可以被进一步细分为两种类型：（a）完全防御；（b）仅探测（detection only）。 ...

AI安全---对抗攻击防御措施

草棚

06-02

3976

目前，在对抗攻击防御上存在三个主要方向： 1）在学习过程中修改训练过程或者修改的输入样本。 2）修改网络，比如：添加更多层/子网络、改变损失/激活函数等。 3）当分类未见过的样本时，用外部模型作为附加网络。 1.改训练过程/ 输入数据 1 蛮力对抗训练通过不断输入新类型的对抗样本并执行对抗训练，从而不断提升网络的鲁棒性。为了保证有效性，该方法需要使用高强度的对抗样本，并且网络架构要有充足的...

Open-set Adversarial Defense

sinat_36059653的博客

05-09

590

Open-set Adversarial Defense 文章目录Open-set Adversarial Defense背景：proposed methodNoise-free Feature EncodingOpen-set ClassificationDecoder：Clean Image GenerationTransformation classification：Self-supervised Denoising实验close-set accuracyopen-set accurancyOut-

李宏毅机器学习——对抗攻击Adversarial Attack

iwill323的博客

10-27

3415

李宏毅机器学习——对抗攻击Adversarial Attack

【图对抗】Local-Global Defense against Unsupervised Adversarial Attacks on Graphs

nbwjszd的博客

12-18

892

原文标题： Local-Global Defense against Unsupervised Adversarial Attacks on Graphs 原文代码： https://github.com/jindi-tju/ULGD/blob/main 发布年度： 2023 发布期刊： AAAIUnsupervised pre-training algorithms for graph representation learning are vulnerable to adversarial attac

pcl-adversarial-defense:在ICCV 2019中通过限制深度神经网络的隐藏空间进行对抗性防御

03-16

通过限制深层神经网络（ICCV'19）的隐藏空间进行对抗性防御该存储库是ICCV'19论文《的PyTorch实施，它。为了对抗对抗性攻击，我们提出了原型一致性损失，以按类别区分深度网络的中间特征。从图中可以看出，存在这样的对抗样本的主要原因是潜在特征空间中学习特征的紧密接近。我们提供了用于重现论文结果的脚本。克隆存储库将此存储库克隆到所需的任何位置。 git clone https://github.com/aamir-mustafa/pcl-adversarial-defense cd pcl-adversarial-defense Softmax（交叉熵）训练为了加快针对我们提出的损失形成聚类的过程，我们首先使用交叉熵损失训练模型。 softmax_training.py （用于初始softmax训练）。经过培训的检查点将保存在Models_Softmax文

Efficient Defenses Against Adversarial Attacks

10-04

Deep learning has proven its prowess across a wide range of computer vision applications, from visual recognition to image generation [17]. Their rapid deployment in critical systems, like medical imaging, surveillance systems or security-sensitive applications, mandates that reliability and security are established a priori for deep learning models. Similarly to any computer-based system, deep learning models can potentially be attacked using all the standard methods (such as denial of service or spoofing attacks), and their protection only depends on the security measures deployed around the system. Additionally, DNNs have been shown to be sensitive to a threat specific to prediction models: adversarial examples. These are input samples which have deliberately been modified to produce a desired response by a model (often, misclassification or a specific incorrect prediction which would benefit the attacker)

Adversarial Defense by Restricting the Hidden Space of Deep Neural Networks

MTandHJ的博客

07-11

582

文章目录概主要内容 Mustafa A., Khan S., Hayat M., Goecke R., Shen J., Shao L., Adversarial Defense by Restricting the Hidden Space of Deep Neural Networks, arXiv preprint arXiv:1904.00887, 2019. 代码概类似的, 是large margin的思想, 亮点是多层? 主要内容以下, flf^lfl表示第lll层的输入, fff为最

网络空间对抗防御中的智能监测技术研究

weixin_70923796的博客

08-18

312

摘要：网络空间数据流观测与威胁行为分析是国家网络空间安全防御中的重要方向。为应对国家网络空间大规模数据流观测和不断涌现的网络威胁对抗防御重大需求，针对传统基于时域、依赖先验知识的网络数据流威胁监测方法存在分析效率低、准确率低、误报率高等不足，在调研分析现有网络流智能检测技术和提取公开科学问题的基础上，借鉴电磁世界频谱、光谱理论，围绕“域变换”“谱推导”总体解决思路，提出网络空间流谱基础理论，给出流谱、变换空间的定义及网络流特征矩阵、流谱变换的数学表示，从可分离性、

CVPR2020 Adversarial Attack & Defense Summary（Part 1）

sydukee的博客

12-09

727

Alleviation of Gradient Exploding in GANs: Fake Can Be Real 解决问题：GAN的梯度爆炸、模式崩溃问题。解决方法：在一个mini batch 中 close pairs 多的位置选取假样本，认定其为真样本，再进行训练，来有效防止不平衡分布的产生（FARGAN）。 Cooling-Shrinking Attack: Blinding the Tracker with Imperceptible Noises 解决问题：提出一种以无模型方式攻击单目标

对抗防御概述与相关

小C的博客

11-05

1993

【时间】2019.11.05 【题目】对抗防御概述与相关 1、新网络安全军备竞赛场：对抗样本防护资讯，提到了现有的一些对抗样本防御方法。资源汇总：Awesome Knowledge Distillation 1）防御性蒸馏思路是：Papernot等人在其论文《Distillationas a defense to adversarial perturbations against...

学习笔记：【VALSE短教程】《Adversarial Attack and Defense》

wangsanNOLOVE的博客

11-12

3724

学习笔记：【VALSE短教程】《Adversarial Attack and Defense》视频地址 1、White-box attacks Direction I 论文地址： EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES 论文地址： ADVERSARIAL EXAMPLES IN THE PHYSICAL WORLD 论文地址： Towards Deep Learning Models Resistant to Adversarial Atta

整理了一些防御对抗样本的方法

qq_37633207的博客

10-17

1885

文章目录防御对抗样本的方法重采样降噪-谱减法区域攻击ATTENTION 用在攻击ATNS上防御对抗样本的方法重采样重采样的过程如下：首先假设对抗样本的音频格式的采样率为16khz 首先对音频进行下采样，下降到8khz的音频假设原始音频的采样率为Q，目标音频的采样率为P，则下采样就是对原始音频每隔Q/P-1个取一个点如上面的16khz下采样到8khz就是媚间隔1个点采样一次，这样采样结束后与原对抗样本相比少了一个采样点然后再通过插值的方法进行上采样，通过插值方式插入降噪-谱减法谱减法原理

对抗样本(论文解读四): Adversarial Attacks and Defenses in Images, Graphs and Text: A Review

Enjoy_endless

12-09

3325