deep learning

Atack and Defence

对抗来自人类的恶意

  • 比如垃圾邮件,发送垃圾邮件的人会试图伪装自己,让垃圾检测模型把邮件判定为正常邮件。
  • 比如对图片施加噪音,例如让一张很像猫的图片(人无法分辨),但是机器把它辨识成🐟
  • 信息隐藏
如何攻击(比较容易)
没有目标的攻击

与正确的目标越远越好

有目标的攻击

与正确的目标越远越好,同时与某个错误的目标(自己设计)越接近越好

distance的定义
  1. L2-norm: d(x0,x’)=||x0-x’||2
  2. L-infinity: d(x0,x’)=||x0-x’||
    总结:distance的设计应该根据人类的感知去定义。 对于图像领域,L-infinity更加适用。

d(x0,x’)≤
x*=arg min L(x’)

如何防御(比较难)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值