论文阅读（2）Watermarking Pre-trained Encoders in Contrastive Learning

父子文

已于 2024-01-25 17:30:10 修改

阅读量1.2k

点赞数 32

分类专栏：论文阅读系列文章标签：论文阅读人工智能深度学习

于 2024-01-25 06:08:50 首次发布

本文链接：https://blog.csdn.net/Study____forever/article/details/135835074

版权

论文阅读系列专栏收录该内容

4 篇文章 0 订阅

订阅专栏

Motivation

建立预训练的编码器需要耗费大量的数据和计算资源，因此需要好好保护。
将现有的水印技术从传统的分类任务迁移到对比学习场景中具有挑战性：
- 编码器拥有者缺乏未来编码器应用于下游任务的知识，因此很难制作相应的后门和验证样本
- 验证过程中，编码器拥有者只能获得分类层最终输出，而不能获得编码器的特征表示，妨碍后门的检验

Approach

引入一个与任务无关的损失函数来微调水印嵌入模型，使得使用带有触发器的样本（即验证样本）输出与普通编码器的输出有很大的偏差。当所有者使用验证样本来查询某模型，若其标签与正常情况不同，则认为该模型是抄袭模型。

应用场景：编码器所有者对下游任务一无所知，并且旨在保护从他的预训练编码器开发的任何模型的知识产权。

Method

在这里插入图片描述

Watermark Embedding

为了将水印嵌入到编码器 $f$ 中，所有者预先定义触发图案 $t$ 和触发掩码 $m$ ，对于每个样本 $x_I$ ，可以计算出对应的触发样本：
$x_i^t=(1-m) \otimes x_i+m\otimes t$
Uniqueness：通过最大化编码器输出差异，可以以非常高的概率最大化下游模型的输出（即标签）的差异。因此引入以下损失项：
$\mathcal{L}_u=\frac{1}{|| \mathcal{D} ||} \cdot \sum_{x_i \in \mathcal{D}}SIM(f(x_i),f'(x_i^t))$
Functionality-preserving：对于干净样本（无触发器），通过使 $f^{'}$ 和正常编码器 $f$ 的输出特征相近，来保持下游模型在干净样本上的预测精度。因此引入以下损失项：
$\mathcal{L}_p=-\frac{1}{||\mathcal{D}||}\cdot \sum_{x_i \in \mathcal{D}}SIM(f(x_i),f'(x_i))$
由此，水印嵌入过程可表示为如下优化问题
$\min_{f'}(\mathcal{L}_u+\eta \cdot \mathcal{L}_p)$
Robustness：为了进一步增强编码器水印的鲁棒性，作者提出在水印嵌入过程中采用 dropout 的方法。