神经网络可以被劫持？谷歌大脑研究员演示AI黑客行为

最新推荐文章于 2024-02-27 00:30:00 发布

人工智能观察

最新推荐文章于 2024-02-27 00:30:00 发布

阅读量1.3k

点赞数

640?wx_fmt=gif

本文由人工智能观察编译

译者：Sandy

计算机视觉算法并不完美。上个月，研究人员证明了一个流行的对象检测API可能会被愚弄，在一些情况下，算法可以将猫识别为“疯狂的被子”，“迷彩”，“马赛克”和“拼凑图”。当然，这还不是最糟糕的情况：它们还有可能被劫持，执行本不该做的任务。

谷歌的人工智能研究部门Google Brain的研究人员在一篇名为《神经网络的对抗重组》的论文中，描述了一种本质是重新编程机器学习系统的对抗方法。这种转移学习的新形式甚至不要求攻击者指令输出。

对此，研究人员表示：“我们的研究结果首次证明了针对神经网络重新编程的敌对攻击的可能性。这些结果表明，深层神经网络带有令人惊讶的灵活性和脆弱性。”

其工作流程是这样的：攻击者获得了一个参与对抗神经网络的参数后，这个神经网络正在执行一个任务，然后以转换为输入图像的形式引入干扰或对抗数据。当敌对的输入被嵌入到网络中，他们就可以将其学习的特性重新设计为另一项新的任务。

科学家们在6个模型中测试了这个方法。通过嵌入来自MNIST计算机视觉数据集的操作输入图像，他们成功获得了所有六种算法来计算图像中方块的数量，而不仅仅是识别像"白鲨"或"鸵鸟"这样的物体。在第二个实验中，他们强迫其对数字进行分类。之后第三次测试，他们使用了识别来自cifar 10的图像的模型，这是一个对象识别数据库，而不是他们最初接受的ImageNet语料库。

640?wx_fmt=png