【论文笔记】Targeted Backdoor Attacks on Deep Learning Systems Using Data Poisoning

最新推荐文章于 2024-04-24 09:36:17 发布

qq_21281385

最新推荐文章于 2024-04-24 09:36:17 发布

阅读量4.6k

点赞数 1

分类专栏：论文笔记文章标签： AI Cryptography and Security

论文笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

该研究探讨了一种新型攻击——后门注入攻击，攻击者通过在训练数据中添加少量有毒样本，在身份验证系统中创建后门，以高成功率绕过系统。攻击者无需了解模型细节，只需注入有限的有毒实例。研究分析了不同的后门注入策略，并在YouTube Aligned Face数据集上使用DeepID和VGG-Face模型进行了评估。

摘要由CSDN通过智能技术生成

Targeted Backdoor Attacks on Deep Learning Systems Using Data Poisoning

Abstract
I.Introduction
II.BACKDOOR POISONING ATTACKS
III. BACKDOOR POISONING ATTACK STRATEGIES
- A. Input-instance-key strategies
- B. Pattern-key strategies
IV. EVALUATION SETUP
V. 对不同攻击策略进行评估
VI. 对真照片进行评估--如戴墨镜的照片，不是正脸的照片等等
VII. EVALUATION OF POTENTIAL (FAILING) DEFENSES

Abstract

在这项工作中，我们考虑一种称为Backdoor Attack的新型攻击，其中攻击者的目标是在基于学习的身份验证系统中创建Backdoor，以便他可以通过利用Backdoor轻松绕过系统。
backdoor poisoning attacks 注射有毒样本到训练集
Assume
1. 对模型和训练集未知
2. 只能注射少量有毒样本
3. 人类也难以注意到来获取隐蔽性
注射五十个样本，获得90%的攻击成功率

I.Introduction

II.BACKDOOR POISONING ATTACKS

A. Backdoor Attack in a Learning System

Machine learning classification system

机器学习分类问题旨在从N对的训练数据集中学习从输入空间X到标签空间Y的映射D = {（xi，yi）∈X×Y | i = 1，…，N

Backdoor Adversary in a Learning System

A target Label $y_t$
攻击者根据（ $y_t$ , $k$ , $\Sigma$ ）使得概率 $\operatorname{Pr}\left(f_{\theta}\left(x^{\mathbf{b}}\right)=y^{\mathbf{t}}\right)$ 高。把由backdoor key生成的数据认为是目标类。

B. Backdoor Adversary Using Data Poisoning

在这项工作中，我们定义并研究了一种弱和真实的攻击场景，称为BACKDOOR POISONING ATTACKS，攻击者可以通过在训练数据集中添加一些中毒样本来欺骗学习系统来进行backdoor attack，而无需直接访问实际的学习系统。

Backdoor poisoning adversary strategies.

生成中毒样本对 $\left(x_{i}^{\mathbf{p}}, y_{i}^{\mathbf{p}}\right)$ 。中毒实例，中毒样本
在测试阶段，生成backdoor 实例 $\Sigma(k)$ ，使用Backdoor Key k和后门实例生成函数，然后由受害者模型将其错误分类为目标标签 $y_t$ 的概率很高

Threat model

无知识，中毒样本少

论文目标是探究不同 BACKDOOR POISONING 攻击策略。在试验阶段展示不同的攻击策略在不同测度的表现情况。

III. BACKDOOR POISONING ATTACK STRATEGIES

A. Input-instance-key strategies

目标 $\Sigma(k)$ 能得到高概率。例子选一张脸，把这张脸把这张脸认为是目标。考虑脸的变动问题。 $\Sigma_{\mathrm{rand}}(x)=\left\{\operatorname{clip}(x+\delta) | \delta \in[-5,5]^{H \times W \times 3}\right\}$
生成函数的例子。生成出来的图像在人眼看来一样，然而像素值的不同，所以是不同的实例。

把部分 $\Sigma(k)$ 放入训练集，然后在测试阶段测试其他 $\Sigma(k)$ 是否可以分类为目标标签。 $\Sigma(k)$ 与k是相似的。

B. Pattern-key strategies

key 是样式

样式插入函数 $\Pi(k, x)=x^{\prime}$ ， x是好样本

Blended Injection strategy 像素叠加 $\Pi_{\alpha}^{\mathrm{blend}}(k, x)=\alpha \cdot k+(1-\alpha) \cdot x$
Accessory Injection strategy 部分像素替换 $\Pi^{\mathrm{accessory}}(k, x)_{i, j}=\left\{\begin{array}{ll}{k_{i, j},} & {\text { if }(i, j) \notin R(k)} \\ {x_{i, j},} & {\text { if }(i, j) \in R(k)}\end{array}\right.$
Blended Accessory Injection strategy 要变的部分就变，不变的部分不变
$\Pi_{\alpha}^{\mathrm{BA}}(k, x)_{i, j}=\left\{\begin{array}{ll}{\alpha \cdot k_{i, j}+(1-\alpha) \cdot x_{i, j},} & {\text { if }(i, j) \notin R(k)} \\ {x_{i, j},} & {\text { if }(i, j) \in R(k)}\end{array}\right.$

头两种方法得到两个正交目标，所以第三个目标可以把前两种目标结合在一起。