R-Drop: Regularized Dropout for Neural Networks

最新推荐文章于 2024-04-03 09:51:34 发布

红酒暖心也暖胃

最新推荐文章于 2024-04-03 09:51:34 发布

阅读量1k

点赞数

分类专栏： nlp 文章标签： r语言深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zpp13hao1/article/details/122255716

版权

R-Drop是一种正则化策略，通过约束dropout产生的子模型输出分布一致性，解决训练和推理的不一致问题。在神经机器翻译、语言理解、摘要生成、语言建模和图像分类等任务上表现出色。通过双向KL散度控制子模型输出分布，实现在多个任务上的性能提升。

摘要由CSDN通过智能技术生成

论文目的

dropout会给训练和测试的过程中带来不一致，regularize dropout 简单的一致性训练策略，迫使dropout产生的子模型输出分布一致，这是通过约束每个样本两个子模型的输出的双向KL散度来达到的。在 neural machine translation, abstractive summarization, language understanding, language modeling, and image classification五个任务上做了实验。

方法

在这里插入图片描述

R-Drop Regularization

training data $D={(x_i,y_i)}_{i=1}^n$
loss function $L_{nll}=\frac{1}{n}\sum_{i=1}^n-\log p^w(y_i|x_i)$

最低0.47元/天解锁文章

红酒暖心也暖胃

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

红酒暖心也暖胃 CSDN认证博客专家 CSDN认证企业博客

码龄8年

51: 原创

12万+: 周排名

2万+: 总排名

10万+: 访问

: 等级

1516: 积分

49: 粉丝

74: 获赞

65: 评论

86: 收藏

私信

关注

热门文章

分类专栏

AIGC 2篇
nlp 16篇
李航-统计学习方法 2篇
leetcode 8篇

最新评论

idea远程连接hive
文科生的编程路: https://www.cnblogs.com/shayue/p/ben-despark-zhi-jie-ji-qun-shang-dehive.html#:~:text=%E6%9C%AC%E5%9C%B0IDEA%E4%B8%AD%E4%BD%BF%E7%94%A8Spark%E7%9B%B4%E8%BF%9E%E9%9B%86%E7%BE%A4%E4%B8%8A%E7%9A%84Hive%201%20%E8%83%8C%E6%99%AF%20%E6%88%91%E7%94%A8VMWare%E6%90%AD%E5%BB%BA%E4%BA%86%E4%B8%80%E4%B8%AAHadoop%E9%9B%86%E7%BE%A4%EF%BC%8CSpark%E4%B8%8EHive%E7%AD%89%E7%BB%84%E4%BB%B6%E9%83%BD%E5%B7%B2%E7%BB%8F%E5%AE%89%E8%A3%85%E5%AE%8C%E6%AF%95%E3%80%82%20%E7%8E%B0%E5%9C%A8%E6%88%91%E5%B8%8C%E6%9C%9B%E5%9C%A8%E6%88%91%E7%9A%84%E5%BC%80%E5%8F%91%E6%9C%BA%E4%B8%8A%E4%BD%BF%E7%94%A8IDEA%E8%BF%9E%E6%8E%A5%E5%88%B0%E9%9B%86%E7%BE%A4%E4%B8%8A%E7%9A%84Hive%E8%BF%9B%E8%A1%8C%E7%9B%B8%E5%85%B3%E6%93%8D%E4%BD%9C%E3%80%82%202%20%E8%BF%9B%E8%A1%8C%E9%85%8D%E7%BD%AE%E4%BF%AE%E6%94%B9%20%E4%BF%AE%E6%94%B9Hive%E4%B8%AD%E7%9A%84hive-site.xml,%E6%9C%AC%E5%9C%B0IDEA%E4%BD%BF%E7%94%A8%20%E7%A4%BA%E4%BE%8B%E4%BB%A3%E7%A0%81%E5%A6%82%E4%B8%8B%EF%BC%9A%20import%20ml.dmlc.xgboost4j.scala.spark.%20...%204%20pom.xml%20
Simple Contrastive Representation Adversarial Learning for NLP Tasks
weixin_45916750: 有源码吗，感谢
suitesparse1.3.0配win10+vs2015
qq_42466012: 方便自己，方便他人，非常赞！
Simple Contrastive Representation Adversarial Learning for NLP Tasks
红酒暖心也暖胃: 在有监督的训练中，使用对抗样本作为原始样本的正样本；而无监督的训练中，利用第一个dropout来生成正对，对抗样本也会被用来作为正对
Simple Contrastive Representation Adversarial Learning for NLP Tasks
Hei.L: 样本经过两次dropout之后形成正对，负对应该是同一batch内的其他样本构成的吧

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。