BERT：nlp领域跨时代的预训练模型

最新推荐文章于 2023-04-15 23:16:00 发布

shun-ripking

最新推荐文章于 2023-04-15 23:16:00 发布

阅读量442

点赞数

分类专栏：自然语言处理文章标签： BERT nlp 自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chengshunhang/article/details/110349507

版权

BERT模型在2018年引领了NLP领域的变革，其预训练和微调机制、Transformer结构以及Masked LM和Next Sentence Prediction等技术，使得模型能适应多种NLP任务。BERT通过双向Transformer解决了传统词向量忽视语境的问题，预训练后的模型可用于各种任务的微调。

摘要由CSDN通过智能技术生成

2018年是nlp重大改革的一年，bert的横空出世使得未来nlp的发展有利跨时代的进步，其在多个领域的完美成功使nlp研究方向有了很大的改变，一直到现在很多比赛的榜单都是由bert或者其畸形霸占。本文让我们简单了解bert，看看它是如何达到如此成就的。

Bert：

bert其实并没想象中的那么复杂，只要了解其中的几个知识点和两幅图便可以知晓它的原理和思想。而bert与其他网络之间也有很多参考和改变，详细见前篇博客：Pre-training in nlp | Ripshun Blog

知识点：

contextual word representation 语义词表征
pre-training and fine-tuning 预处理和微调
transfromer
WordPiece：字面意思，把word拆成piece一片一片
（token，position，segment） embedding
Masked LM And Next Sentence Prediction (NSP)

contextual word representation

传统的词向量嵌入方法（word2vec等等）没有考虑词的语义，即一词多义。在ELMO之中注意到了这一点。ELMO通过双向LS

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。