最新语言表示学习方法XLNet，在20项任务上超越BERT

最新推荐文章于 2024-06-04 09:47:08 发布

Doit_行之

最新推荐文章于 2024-06-04 09:47:08 发布

阅读量3.1k

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_31456593/article/details/93015488

版权

最新语言表示学习方法XLNet，在20项任务上超越BERT

原文地址：https://blog.csdn.net/qq_31456593/article/details/93015488

摘要：凭借对双向上下文进行建模的能力，与基于自回归语言建模的预训练方法相比，基于BERT的基于自动编码的预训练实现了更好的性能。然而，依赖于对输入使用掩码，BERT忽略了屏蔽位置之间的依赖性，并且受到预训练 - 微调差异的影响。根据这些优点和缺点，我们提出了XLNet，一种广义自回归预训练方法，它（1）通过最大化分解阶的所有排列的预期可能性来学习双向上下文，并且（2）由于其自回归性，克服了BERT的局限性。此外，XLNet将最先进的自回归模型Transformer-XL的创意整合到预训练中。根据实验，XLNet在20个任务上的表现优于BERT，且都有大幅度提升，并在18个任务中实现最先进的结果，包括问答，自然语言推理，情感分析和文档排名。

无监督表示学习在自然语言处理领域非常成功[7,19,24,25,10]。通常，这些方法首先在大规模标记的文本语料库上预先训练神经网络，然后对下游任务的模型或表示进行微调。在这个共享的高层次思想下，文献中探讨了不同的无监督预训练目标。其中，自回归（AR）语言建模和自动编码（AE）是两个最成功的预训练目标.

AR语言建模试图用自回归模型估计文本语料库的概率分布[7,24,25]。具体地，给定文本序列x =（x1，…，xT），AR语言建模将可能性分解为前向乘积 $p(x)=\prod_{t=1}^T P(x_t|x_{>t})$

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。