XLNet与BERT以及语言模型的对比

最新推荐文章于 2024-06-02 20:52:06 发布

醒了的追梦人

最新推荐文章于 2024-06-02 20:52:06 发布

阅读量1.5k

点赞数 1

分类专栏：机器学习and深度学习文章标签： XLNet BERT 语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33472146/article/details/94409605

版权

机器学习and深度学习专栏收录该内容

43 篇文章 15 订阅

订阅专栏

XLNet与BERT的对比
XLNet和BERT都是预测一个句子的部分词，但是背后的原因是不同的。BERT使用的是Mask语言模型，因此只能预测部分词(总不能把所有词都Mask了然后预测？)。而XLNet预测部分词是出于性能考虑，而BERT是随机的选择一些词来预测。

除此之外，它们最大的区别其实就是BERT是约等号，也就是条件独立的假设–那些被MASK的词在给定非MASK的词的条件下是独立的。但是我们前面分析过，这个假设并不(总是)成立。

XLNet与语言模型的对比
和语言模型相比，XLNet最大的优势就是通过输入序列的各种排列，同时学习到上下文的信息。

醒了的追梦人

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
XLNet与BERT以及语言模型的对比

XLNet与BERT的对比XLNet和BERT都是预测一个句子的部分词，但是背后的原因是不同的。BERT使用的是Mask语言模型，因此只能预测部分词(总不能把所有词都Mask了然后预测？)。而XLNet预测部分词是出于性能考虑，而BERT是随机的选择一些词来预测。除此之外，它们最大的区别其实就是BERT是约等号，也就是条件独立的假设–那些被MASK的词在给定非MASK的词的条件下是独立的。但是...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。