自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 论文阅读笔记——How Hard Is Trojan Detection In Dnns

检测trojan的技术很有效,但trojan逃避检测的工作较少。提出一种新方法,让trojan逃避通用检测,结合了分布匹配、特异性和随机化,以消除木马网络的显著特征。难检测、高ASR、难逆向。

2022-11-10 15:25:31 203 2

原创 论文阅读笔记——Backdoor Defense with Machine Unlearning

提出了一种新的方法BAERASER,可以消除注入 victim model 的后门。

2022-11-10 11:15:16 397

原创 论文阅读笔记——Handcrafted Backdoors in Deep Neural Networks

模型外包或者使用预训练模型容易导致后门攻击。之前注入后门的方法局限于投毒。作者提出一种新的攻击方法,直接操作预训练模型的参数来注入后门。有更大的自由度。不能通过直接的方法如统计分析,在模型参数中添加随机噪声,或在一定范围内裁剪它们的值来防御。这种手工操作的方法还可以和其他方法结合起来,例如联合优化触发器模式,以有效地将后门注入到复杂的网络中——Meet-in-the-Middle Attack(MITM Attack)。

2022-11-10 11:06:34 181 1

原创 论文阅读笔记——Adversarial Attack on Attackers Post-Process to

提出了一种针对 SQAs 的新型的防御方式——Adversarial Attack on Attackers (AAA), confound the score-based query attacks (SQAs) towards incorrect attack directions by slightly modifying the output logits.优点:预防了SQAs(effective);CA不掉;改进置信度分数的标准(user-friendly);通用性好;

2022-11-06 22:36:34 493 1

原创 论文阅读笔记——Backdoor Defense with Machine Unlearning

提出了一种新的方法BAERASER,可以消除注入 victim model 的后门。具体来说,橡皮主要通过两个关键步骤实现后门防御。首先,进行 trigger pattern 恢复,提取被受害者模型感染的触发模式。这里的触发模式恢复问题相当于从受害者模型中提取未知噪声分布的问题,可以通过基于熵最大化的生成模型轻松解决。随后,诱饵利用这些恢复的触发模式来逆转后门注入过程,并通过一种新设计的基于梯度上升的 machine unlearning 方法,诱导受害者模型来消除被污染的记忆。

2022-11-03 16:51:35 645

原创 论文阅读笔记——How Hard Is Trojan Detection In Dnns

检测trojan的技术很有效,但trojan逃避检测的工作较少。提出一种新方法,让trojan逃避通用检测,结合了分布匹配、特异性和随机化,以消除木马网络的显著特征。难检测、高ASR、难逆向。

2022-10-28 16:27:27 392

原创 论文阅读笔记——Handcrafted Backdoors in Deep Neural Networks

模型外包或者使用预训练模型容易导致后门攻击。之前注入后门的方法局限于投毒。作者提出一种新的攻击方法,直接操作预训练模型的参数来注入后门。有更大的自由度。不能通过直接的方法如统计分析,在模型参数中添加随机噪声,或在一定范围内裁剪它们的值来防御。这种手工操作的方法还可以和其他方法结合起来,例如联合优化触发器模式,以有效地将后门注入到复杂的网络中——Meet-in-the-Middle Attack(MITM Attack)。

2022-10-21 15:28:05 449 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除