Ge, Yunjie, et al. “Anti-Distillation Backdoor Attacks: Backdoors Can Really Survive in Knowledge Distillation.” Proceedings of the 29th ACM International Conference on Multimedia. 2021.
Anti-Distillation Backdoor Attacks: Backdoors Can Really Survive in Knowledge Distillation
介绍
这篇论文介绍额是一种能够抵御知识蒸馏攻击的后门。这里的后门攻击能够从教师模型迁移到学生模型的后门攻击。
本文第一次,提出一种新的Anti-Distillatio Backdoor Attack ( ADBA) ,其中嵌入公共的老师模型的后门能够在知识蒸馏过程中被保留下来,从而转移到学生模型中。
做法
这里首先通过引入一个 shadow 模型来模拟蒸馏过程,并采用一个可以优化的触发集来传递信息,从而帮助制作一个教师模型。