人工智能、深度学习、机器学习常见面试题321~324

最新推荐文章于 2024-10-04 08:54:00 发布

fpga和matlab

最新推荐文章于 2024-10-04 08:54:00 发布

阅读量647

点赞数 1

分类专栏： ★求职1:深度学习/FPGA/机器视觉/算法手撕代码文章标签：机器学习人工智能深度学习人工智能面试深度学习面试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ccsss22/article/details/126409508

版权

★求职1:深度学习/FPGA/机器视觉/算法手撕代码专栏收录该内容

127 篇文章 57 订阅 ¥39.90 ¥99.00

订阅专栏

本文探讨了XLNet与BERT两种预训练语言模型的差异与优劣。XLNet作为自回归预训练方法，融合了BERT的双向信息处理能力，解决了预训练与微调不一致的问题，尤其适合生成类NLP任务。文章详细解释了XLNet的Permutation Language Model和BERT的Masked Language Model，指出两者本质相似，但XLNet在处理长文档和生成任务上更具优势。

摘要由CSDN通过智能技术生成

目录

321.什么是XLNet？

322.自回归语言模型（Autoregressive LM）

323.自编码语言模型（Autoencoder LM）

324.XLNet与BERT比较

321.什么是XLNet？

XLNet 是一个类似 BERT 的模型，而不是完全不同的模型。总之，**XLNet是一种通用的自回归预训练方法**。它是CMU和Google Brain团队在2019年6月份发布的模型，最终，XLNet 在 20 个任务上超过了 BERT 的表现，并在 18 个任务上取得了当前最佳效果（state-of-the-art），包括机器问答、自然语言推断、情感分析和文档排序。

322.自回归语言模型（Autoregressive LM）

在ELMO／BERT出来之前，大家通常讲的语言模型其实是根据上文内容预测下一个可能跟随的单词，就是常说的自左向右的语言模型任务，或者反过来也行，就是根据下文预测前面的单词，这种类型的LM被称为自回归语言模型。GPT 就是典型的自回归语言模型。ELMO尽管看上去利用了上文，也利用了下文，但是本质上仍然是自回归LM，这个跟模型具体怎么实现有关系。ELMO是做了两个方向（从左到右以

了解本专栏

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

fpga和matlab 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。