《机器学习安全及隐私保护研究进展》学习笔记

本文探讨了机器学习中的攻击者模型,从机密性、完整性和可用性三个方面阐述攻击者的目标。分析了攻击者的知识范围,包括训练数据、模型架构等,并介绍了不同级别的攻击者能力。同时,详细介绍了训练和预测阶段的安全威胁,如投毒攻击和对抗攻击,分别阐述了白盒和黑盒攻击策略。文章强调了防御技术在应对这些威胁中的重要性。
摘要由CSDN通过智能技术生成



1. 攻击者模型(Adversary Model)

原文中,将 adversary model 翻译成“敌手”,我觉得不是很恰当,这里直译为攻击者。

1.1 攻击者目标(从 CIA 三方面来看)

  • 机密性
  • 完整性
  • 可用性

1.2 攻击者知识

  • 训练数据(training data)
  • 模型架构(model structure)
  • 参数(parameters)
  • 决策函数(decision function)
    • 黑盒模型(black-box)
    • 白盒模型(white-box)

1.3 攻击者能力

  • 数据控制能力的不同:

    • 强攻击者
    • 弱攻击者
  • 训练阶段中:

    • 访问训练数据
    • 注入恶意数据
    • 直接修改数据

1.4 攻击者策略

  • 为达到攻击目标,采取的具体攻击方式


2. 机器学习安全威胁及防御技术

2.1 机器学习常见的安全性威胁:

2.1.1 训练阶段的安全威胁
1. 投毒攻击(poisoning attack)
  • [1]:随机修改40%训练数据标签,在二分类中无法正常分类(SVM)。
  • [2-3]:注入精心制作的恶意样本,使决策边界改变。误分类(较常见)
  • [4-5]:在新收集的数据上投毒
2.1.2 预测阶段的安全威胁
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值