论文研读|An Embarrassingly Simple Approach for Intellectual Property Rights Protection on RNNs

在这里插入图片描述


论文信息

论文名称:An Embarrassingly Simple Approach for Intellectual Property Rights Protection on Recurrent Neural Networks
作者:Zhi Qin Tan et al. Universiti Malaya
发表年份:2022
发表会议:AACL | IJCNLP
开源代码:https://github.com/zhiqin1998/RecurrentIPR

文章简介

本文提出一种使用白盒或黑盒的方式保护RNN模型版权的鲁棒水印方法,对移除攻击和伪造攻击具有很好的鲁棒性。

在这里插入图片描述

研究动机

基于RNN的NLP模型应用广泛,然而对此类模型的版权保护工作未被引起足够的重视,仅有(Lim et al. 2022)一项相近的工作。基于此,本文提出GateKeeper,借助RNN模型的门限控制单元嵌入水印信号。

研究方法

本文提出黑盒水印和白盒水印的两种模型版权保护方式。

白盒水印

水印信号构造

在这里插入图片描述

黑盒水印

触发集构造

针对文本分类任务,选择 t t t 个训练样本,通过标签互换得到触发集;针对机器翻译任务,本文设计了两种触发集构造方式(1)跨域数据标签互换(2)源语言和目标语言均为随机词汇组合而成。
在这里插入图片描述

水印嵌入

本文设计了Private Ownership Scheme 和 Public Ownership Scheme 两种模式。Algorithm 1 为 Public Ownership Scheme 的训练流程,通过这种方式,可以同时嵌入白盒水印和黑盒水印。

在这里插入图片描述

实验结果

任务选取:文本分类(TREC-6)&机器翻译(WMT14 EN-FR)

保真度 & 有效性

由 Table 2 可知,正确的密钥能够确保模型的原始性能,并成功触发黑盒水印;然而错误的密钥会使模型的原始任务性能下降,无法成功触发黑盒水印。
在这里插入图片描述
此外,Table 2 反映出水印的添加会使得模型的训练时间成本增大。但由于训练是由模型所有者完成,因此影响不是很大。相反,水印的添加对模型的推断时间影响要尽可能小,因为这直接关系到模型使用者的体验。

鲁棒性

抗移除攻击(Removal Attack)

抗模型剪枝(Model Pruning)

在这里插入图片描述

抗微调攻击(Fine-Tuning)

由 Table 4 可知,本文提出的水印方法能够抵抗微调攻击。

抗水印覆写攻击(Overwriting)

由 Table 4 可知,本文提出的水印方法能够抵抗水印覆写攻击。
在这里插入图片描述

抗伪造攻击(Anti-Ambiguity Attacl)

由 Table 2 和Figure 5可知,伪造密钥不但会损害模型的原始任务精度,还会影响黑盒水印的验证精度,并且随着伪造密钥与正确密钥的差异增大,损害程度也会加深。因此本文提出的水印方法能够很好地抵御伪造攻击。

在这里插入图片描述

隐蔽性

Figure 6 展示了水印嵌入前后模型参数的分布变化,由结果可知,水印的隐蔽性较强。
在这里插入图片描述

迁移性

本文将应用场景迁移至CV领域,将2D图像看作像素序列输入RNN进行实验,结果如Table 5所示,证实了本文提出水印方法的课迁移性。
在这里插入图片描述

Case Study

在这里插入图片描述

方法评估

这篇文章提出保护RNN模型版权的黑盒水印和白盒水印方法,和这篇文章出自同一个团队,本文实验充分,

相关文献

Jian Han Lim, Chee Seng Chan, Kam Woh Ng, Lixin Fan, and Qiang Yang. 2022. Protect, show, attend and tell: Empowering image captioning models with ownership protection. Pattern Recognition, 122:108285.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

_Meilinger_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值