- 博客(7)
- 收藏
- 关注
原创 论文阅读笔记——How Hard Is Trojan Detection In Dnns
检测trojan的技术很有效,但trojan逃避检测的工作较少。提出一种新方法,让trojan逃避通用检测,结合了分布匹配、特异性和随机化,以消除木马网络的显著特征。难检测、高ASR、难逆向。
2022-11-10 15:25:31 203 2
原创 论文阅读笔记——Backdoor Defense with Machine Unlearning
提出了一种新的方法BAERASER,可以消除注入 victim model 的后门。
2022-11-10 11:15:16 397
原创 论文阅读笔记——Handcrafted Backdoors in Deep Neural Networks
模型外包或者使用预训练模型容易导致后门攻击。之前注入后门的方法局限于投毒。作者提出一种新的攻击方法,直接操作预训练模型的参数来注入后门。有更大的自由度。不能通过直接的方法如统计分析,在模型参数中添加随机噪声,或在一定范围内裁剪它们的值来防御。这种手工操作的方法还可以和其他方法结合起来,例如联合优化触发器模式,以有效地将后门注入到复杂的网络中——Meet-in-the-Middle Attack(MITM Attack)。
2022-11-10 11:06:34 181 1
原创 论文阅读笔记——Adversarial Attack on Attackers Post-Process to
提出了一种针对 SQAs 的新型的防御方式——Adversarial Attack on Attackers (AAA), confound the score-based query attacks (SQAs) towards incorrect attack directions by slightly modifying the output logits.优点:预防了SQAs(effective);CA不掉;改进置信度分数的标准(user-friendly);通用性好;
2022-11-06 22:36:34 493 1
原创 论文阅读笔记——Backdoor Defense with Machine Unlearning
提出了一种新的方法BAERASER,可以消除注入 victim model 的后门。具体来说,橡皮主要通过两个关键步骤实现后门防御。首先,进行 trigger pattern 恢复,提取被受害者模型感染的触发模式。这里的触发模式恢复问题相当于从受害者模型中提取未知噪声分布的问题,可以通过基于熵最大化的生成模型轻松解决。随后,诱饵利用这些恢复的触发模式来逆转后门注入过程,并通过一种新设计的基于梯度上升的 machine unlearning 方法,诱导受害者模型来消除被污染的记忆。
2022-11-03 16:51:35 645
原创 论文阅读笔记——How Hard Is Trojan Detection In Dnns
检测trojan的技术很有效,但trojan逃避检测的工作较少。提出一种新方法,让trojan逃避通用检测,结合了分布匹配、特异性和随机化,以消除木马网络的显著特征。难检测、高ASR、难逆向。
2022-10-28 16:27:27 392
原创 论文阅读笔记——Handcrafted Backdoors in Deep Neural Networks
模型外包或者使用预训练模型容易导致后门攻击。之前注入后门的方法局限于投毒。作者提出一种新的攻击方法,直接操作预训练模型的参数来注入后门。有更大的自由度。不能通过直接的方法如统计分析,在模型参数中添加随机噪声,或在一定范围内裁剪它们的值来防御。这种手工操作的方法还可以和其他方法结合起来,例如联合优化触发器模式,以有效地将后门注入到复杂的网络中——Meet-in-the-Middle Attack(MITM Attack)。
2022-10-21 15:28:05 449 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人