【自然语言处理】BERT 讲解

不牌不改

已于 2023-03-02 10:26:29 修改

阅读量508

点赞数 4

分类专栏：【NLP & CV】文章标签：自然语言处理 bert 深度学习人工智能 transformer

于 2023-03-02 10:23:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46221946/article/details/129295543

版权

【NLP & CV】专栏收录该内容

47 篇文章 4 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

BERT模型是基于Transformer的预训练模型，旨在解决ELMo的限制，通过预训练任务如掩码语言模型和下一个句子预测来学习上下文信息。模型由多个Transformer编码器组成，输入包括词元嵌入、段嵌入和位置嵌入。BERT通过微调适应各种下游任务，如分类、标注、语句对分类和问答。预训练阶段的损失函数由MLM和NSP任务的交叉熵损失之和构成。

摘要由CSDN通过智能技术生成

有任何的书写错误、排版错误、概念错误等，希望大家包含指正。

在阅读本篇之前建议先学习：
【自然语言处理】Seq2Seq 讲解
 【自然语言处理】Attention 讲解
 【自然语言处理】ELMo 讲解
 【自然语言处理】Transformer 讲解

BERT

1. 简介

ELMo 模型可以根据上下文更新词的特征表示，实现了词向量由静态向动态的转变，较好的解决了一词多义问题。不过因 ELMo 依赖 LSTM 的架构，仍然属于自动回归问题，导致其训练只能按部就班，严格遵守从左到右或从右到左的次序进行训练，所以在面对特大语料库时将非常耗时，这种局限也直接影响其性能和扩展性。此外&#

了解本专栏

超级会员免费看

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

不牌不改 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。