论文笔记 - BadEncoder: Backdoor Attacks to Pre-trained Encoders in Self-Supervised Learning

WBZhang2022

已于 2023-04-12 08:52:36 修改

阅读量517

点赞数

分类专栏： ▶ Trustworthy AI 文章标签：论文阅读计算机视觉人工智能

于 2022-10-20 23:45:15 首次发布

本文链接：https://blog.csdn.net/weixin_44944722/article/details/127433356

版权

▶ Trustworthy AI 专栏收录该内容

13 篇文章 25 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

该论文首次探讨了自监督学习中的后门攻击，特别是在计算机视觉领域的预训练图像编码器中。攻击者通过BadEncoder在编码器中植入后门，使得下游任务在特定触发器作用下进行错误分类。尽管现有防御方法针对监督学习，但自监督学习的后门攻击需要新的防御策略。论文提出了限制条件，定义了问题并详细阐述了算法思路，包括目标优化函数和BadEncoder的训练过程。

摘要由CSDN通过智能技术生成

文章目录

自监督学习下的后门攻击

自监督学习下的后门攻击

基本信息

论文标题	BadEncoder: Backdoor Attacks to Pre-trained Encoders in Self-Supervised Learning
论文作者	Jinyuan Jia, Yupei Liu, Neil Zhenqiang Gong
科研机构	Duke University
会议	S&P
年份	2022
论文链接	https://arxiv.org/pdf/2108.00352.pdf
开源代码	https://github.com/jjy1994/BadEncoder

核心贡献

首次提出自监督学习后门攻击，（以计算机视觉场景为例子）在预训练的图像编码器植入后门，对于目标下游任务会自动继承编码器的后门，使得下游任务一旦激活后门触发器就会按照攻击者的意愿进行错误分类；
基于现有的后门攻击防

了解本专栏

超级会员免费看

WBZhang2022

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文笔记 - BadEncoder: Backdoor Attacks to Pre-trained Encoders in Self-Supervised Learning

【博主前言】：本篇博客是记录阅读BadEncoder论文，对作者提出的算法以比较通俗易懂的语言总结出的学习笔记，供大家学习参考，由于作者本人能力有限，不可避免出现解读有误，敬请大家批评指正，欢迎大家共同探讨
复制链接

扫一扫

专栏目录