AI—数据中毒

标题 数据中毒

原文链接:https://thenextweb.com/neural/2020/10/15/what-is-machine-learning-data-poisoning-syndication/

通过对上面这篇文章的阅读,以及公众号内的讲解,以下浅谈我对数据中毒的理解。
我理解的数据中毒,举一个简单的例子就是说:我们给很多张某种类型的照片给计算机训练,我们希望得到的结果是,当再给同一种类型的照片给计算机的时候,他可以识别出当前的照片就是该类型的。例如,三站狗狗的照片给计算机训练,当拿另一只狗的照片时,可以告诉我们这张照片上的动物是狗狗,而不是其他的。让计算机可以向我们人眼一样,判断改照片中的内容。但是训练的结果有时候并不如意,例如:假设我们拿给计算机训练的所有照片中的右下角都有一个相同的标签,那么计算机就会误认为,右下角带有这个标签的图片就是对应的狗狗图片,那么这时,我如果拿了一张猫的照片,右下角同样带有相同的标签,那么这张猫的照片就会被计算机理解成狗狗图片,这样就照成了错误。
以上问题的关键是,机器学习模型会锁定强相关性,而不是寻找特征之间的因果关系或逻辑关系。而这一特点,可能会被恶意利用,反过来成为攻击自身的武器。
然而,“数据中毒”并不是要在训练模型的参数中找到问题的关联性,而是要通过修改训练数据,故意将这些关联性植入到模型中。使系统识别出现错误,让入侵者绕过识别,带来了很大的危险。
以上是我的一些理解,如果有错误的地方,希望大家多多指出,谢谢。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值