生成对抗网络 - Adversarial Examples 对抗样本

最新推荐文章于 2022-04-29 22:27:14 发布

mao_feng

最新推荐文章于 2022-04-29 22:27:14 发布

阅读量3.6k

点赞数 1

分类专栏：深度学习文章标签： Deep Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mao_feng/article/details/54744055

版权

本文探讨了神经网络中的对抗样本现象，这些样本通过微小且难以察觉的扰动能显著改变网络预测。研究显示，对抗样本在不同结构和训练的网络中保持有效性，揭示了神经网络的内在弱点。对抗样本的生成涉及到寻找输入空间中的非平滑区域，通过优化方法如最小化畸变函数D来创造。实验表明，这些对抗样本能够成功地误导网络预测。

摘要由CSDN通过智能技术生成

[1] Intriguing properties of neural networks

文章发现，通过在原图是加入一些不可察觉的非随机扰动，可以极大改变网络的预测结果。这些扰动是通过最大化预测误差来训练获得输入的，称这种输入为对抗样本。

对抗例子是相对鲁棒的, 即神经网络A生成的对抗样本，在神经网路B下仍然是，即使B是不同的网络结构、超参、和训练数据。因此，神经网络含有一些内在的盲点和非显示的特征，其结构与数据分布相关。

为了解释网络中激活在特征表达上的含义，有研究者用尝试一些训练图像使得这些特征的激活值达到最大的可视化检测（visual inspection）。研究发现区分变化的因素是跨越整个网络空间的，而不是网络某个单元。如下图。事实上，在对深度神经网络学到的复杂表达来说，单元级局部的可视化检测方法相对网络级全局的方法要差。

这里有个感念叫局部泛化（local generalization）。一个可局部泛化是说输入空间中在训练样本近邻区域也有较高的识别正确率，也就是说不可察觉的非随机扰动是不会影响预测结果的，这是所谓的平滑（smoothness）假设。然而深度神经网络通过堆叠非线性单元来对输入空间进行编码，它是non-local generalization的，即对输入空间中训练样本的领域是无法获得高识别概率的，虽然这些区域不含训练样本，但

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。