Simple Contrastive Representation Adversarial Learning for NLP Tasks

最新推荐文章于 2023-03-09 16:28:30 发布

红酒暖心也暖胃

最新推荐文章于 2023-03-09 16:28:30 发布

阅读量2.1k

点赞数

分类专栏： nlp 文章标签：自然语言处理深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zpp13hao1/article/details/122123047

版权

本文提出了一种结合对比学习和对抗训练的方法，应用于自然语言处理任务，旨在提升模型的泛化能力和鲁棒性。通过对抗性实例增强对比学习，提出有监督的SCAL和无监督的USCAL框架，分别在多个数据集上取得良好效果。

摘要由CSDN通过智能技术生成

论文目的

对比学习是自监督学习在NLP中的应用，本文使用对抗方法生成对比学习需要的训练样本对，对比学习提升了对抗训练的泛华能力，对抗训练也增强了对比学习的鲁棒性，提出了两种结构：supervised contrastive adversarial learning (SCAL) 和 unsupervised SCAL (USCAL)，即有监督的对比对抗训练和无监督的对比对抗训练（USCAL是不是改为UCAL更合适？）。使用监督任务的loss生成对抗训练的实例，无监督任务带来对比损失。在多个数据集上进行测试，效果良好

相关工作

contrastive learning

对比学习被广泛使用于自监督学习，它学习一个encoder表征训练集合里的图片，好的表征能识别相同的物体并区分不同的物体。cv中使用旋转、颜色变化和裁剪等图像变换方式数据增强生成正对，它们在表征空间中彼此接近。对比学习也可以用在有监督学习中充分利用标签数据。SimCLR（对比不同的数据增强方法、大batch、大epoch）、MoCo（动态队列存储更多的负样本、动量缓慢更新保持一致性）、BYOL（只区分minibatch内的）。
这种学习范式在NLP中也有应用，对比学习的关键是生成正对，而在NLP中生成正对是困难的，通常使用回传、删除词语和片段、还有切割句子。SimCSE仅适用dropout提高句子的表达能力，我们的工作也使用dropout增加句子的不同视角，但对抗性实例也作为正对添加到对比损失中，这样不仅增加的模型训练的难度，也使得模型更鲁棒和富有表现力。

Adversarial Training and Adversarial Attack

对抗训练是指用干净的对抗样本训练网络，使得网络可以抵御攻击并提高鲁棒性，在object detection, segmentation and image classification上都有应用。为了完成训练，必须使用干净的样本和网络产生对抗训练样本，使得网络预测错误的类标签。Word-level substitution and sentence-level rephrasing 是典型的文本对抗性攻击。Fast Gradient Sign Method (FGSM) and Fast Gradient Method (FGM) 是本文中使用的对抗训练的方法。
基于对抗和对比训练的在CV和NLP中都有许多工作，本文侧重于对模型encoder向量级别的对抗攻击，并将对抗性实例用于对比损失。在有监督和无监督的两个任务上都提出了框架，并在数据集上获得了好效果。

本文方法

Adversarial Training And Adversarial Attack Methods

数据集 $D = (X, Y)$
映射 $f_{\theta}:X \to Y$
满足 $\delta^*=\arg\max_{\delta}L_{ce}(x+\delta,y;\theta).s.t.|\delta|_p<\varepsilon$
FGSM:
$x^{adv}=x+\delta=x+\varepsilon*sign(\Delta xL_{ce}(x,y;\theta)).s.t.|\delta|_p<\varepsilon$
FGM:
$x^{adv}=x+\delta=x+\varepsilon*(\frac{\Delta xL_{ce}(x,y;\theta)}{|\Delta xL_{ce}(x,y;\theta)|_2}).s.t.|\delta|_p<\varepsilon$

最低0.47元/天解锁文章

红酒暖心也暖胃

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

红酒暖心也暖胃 CSDN认证博客专家 CSDN认证企业博客

码龄8年

51: 原创

10万+: 周排名

2万+: 总排名

10万+: 访问

: 等级

1516: 积分

49: 粉丝

74: 获赞

65: 评论

86: 收藏

私信

关注

热门文章

分类专栏

AIGC 2篇
nlp 16篇
李航-统计学习方法 2篇
leetcode 8篇

最新评论

idea远程连接hive
文科生的编程路: https://www.cnblogs.com/shayue/p/ben-despark-zhi-jie-ji-qun-shang-dehive.html#:~:text=%E6%9C%AC%E5%9C%B0IDEA%E4%B8%AD%E4%BD%BF%E7%94%A8Spark%E7%9B%B4%E8%BF%9E%E9%9B%86%E7%BE%A4%E4%B8%8A%E7%9A%84Hive%201%20%E8%83%8C%E6%99%AF%20%E6%88%91%E7%94%A8VMWare%E6%90%AD%E5%BB%BA%E4%BA%86%E4%B8%80%E4%B8%AAHadoop%E9%9B%86%E7%BE%A4%EF%BC%8CSpark%E4%B8%8EHive%E7%AD%89%E7%BB%84%E4%BB%B6%E9%83%BD%E5%B7%B2%E7%BB%8F%E5%AE%89%E8%A3%85%E5%AE%8C%E6%AF%95%E3%80%82%20%E7%8E%B0%E5%9C%A8%E6%88%91%E5%B8%8C%E6%9C%9B%E5%9C%A8%E6%88%91%E7%9A%84%E5%BC%80%E5%8F%91%E6%9C%BA%E4%B8%8A%E4%BD%BF%E7%94%A8IDEA%E8%BF%9E%E6%8E%A5%E5%88%B0%E9%9B%86%E7%BE%A4%E4%B8%8A%E7%9A%84Hive%E8%BF%9B%E8%A1%8C%E7%9B%B8%E5%85%B3%E6%93%8D%E4%BD%9C%E3%80%82%202%20%E8%BF%9B%E8%A1%8C%E9%85%8D%E7%BD%AE%E4%BF%AE%E6%94%B9%20%E4%BF%AE%E6%94%B9Hive%E4%B8%AD%E7%9A%84hive-site.xml,%E6%9C%AC%E5%9C%B0IDEA%E4%BD%BF%E7%94%A8%20%E7%A4%BA%E4%BE%8B%E4%BB%A3%E7%A0%81%E5%A6%82%E4%B8%8B%EF%BC%9A%20import%20ml.dmlc.xgboost4j.scala.spark.%20...%204%20pom.xml%20
Simple Contrastive Representation Adversarial Learning for NLP Tasks
weixin_45916750: 有源码吗，感谢
suitesparse1.3.0配win10+vs2015
qq_42466012: 方便自己，方便他人，非常赞！
Simple Contrastive Representation Adversarial Learning for NLP Tasks
红酒暖心也暖胃: 在有监督的训练中，使用对抗样本作为原始样本的正样本；而无监督的训练中，利用第一个dropout来生成正对，对抗样本也会被用来作为正对
Simple Contrastive Representation Adversarial Learning for NLP Tasks
Hei.L: 样本经过两次dropout之后形成正对，负对应该是同一batch内的其他样本构成的吧

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。