原创:谭婧
人工智能算法攻与防,始于一个有趣的“捣乱”,在谷歌实验室里。
“捣乱”,纯粹是人为的,自己给自己添乱。
得到的实验室结论是:对输入样本(一张图片)故意添加一些人无法肉眼察觉的细微干扰,可以导致图像分类模型,会以较高的概率(高置信度)给出一个错误的输出。
在现实世界里,“捣乱”就让计算机出错。
2014年的这一结果写在了,谷歌研究员Christian Szegedy博士和其团队的论文《神经网络的有趣特性》(Intriguingproperties of neural networks)中。
论文作者,也觉“有趣”,不信你看论文的题目叫啥。
这可以算,全球最早对人工智能算法攻与防的研究。
或者说,人工智能算法攻与防的研究,肇始于谷歌公司。
论文地址:https://arxiv.org/pdf/1312.6199.pdf
2017年,Ian Goodfellow博士牵头组织了 NIPS 2017 对抗样本攻防竞赛,这是国际上第一次专门举办对抗攻防专竞赛。
这位三十多岁的AI新生代领袖,还有一个江湖称谓,“生成对抗网络之父。”
此网络,彼网络,都是深度学习之网络。
值得一提的是,清华大学朱军教授团队包揽了这次比赛三个赛道的冠军。
也在2017年,AI对抗攻防迎来首个算法开源平台CleverHans,听上去,中文名像“聪明的汉斯”。
由Ian Goodfellow和其团队开发并开源,欢迎来自全球各地的对抗算法开发人员贡献代码。
Cleverhans平台的攻防框架,将攻防算法模块化,全球研究者能在这一平台上,快速研发不同的对抗样本生成算法和防御算法。
Cleverhans交友网址:https://github.com/cleverhans-lab/cleverhans
次年,来自图宾根大学团队推出的Foolbox(直译,傻盒子)图像分类领域的攻防算法库,开源。
Foolbox 交友网址:github.com/bethgelab/foolbox
2019年,谷歌Ian Goodfellow博士团队就曾在2019年的论文“针对自动语音识别的不可察觉的、鲁棒的和有目标的对抗