论文学习笔记 - BERT - 1

最新推荐文章于 2022-08-23 22:04:26 发布

不忘初心，坚持前行

最新推荐文章于 2022-08-23 22:04:26 发布

阅读量307

点赞数 1

分类专栏：论文学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhoulong264433/article/details/88594789

版权

BERT（Bidirectional Encoder Representations from Transformers）是一种自然语言表示模型。BERT是基于上下文信息的深度双向表示模型，通过预训练，可得到文本的深度双向表示。

BERT网络结构

BERT的模型结构图如下。

BERT的每一层都利用了文本预料的上下文信息。其基本结构是Transformer，将其深度堆叠，通过类似全连接网络的方式连接起来。简单来说，相比于全连接网络，BERT是把神经元替换成了Transformer，每一个输出是向量。因此，BERT可以看成是全连接网络和Transformer的结合。

BERT是如何充分使用文本预料上下文信息的？一般意义上的RNN网络，见下图，通常情况下只能利用单向信息，从左到右或从右到左的信息。由于其网络结构的限制，数据只能是以序列的形式依次输入到网络中处理，类似于流水线，一个词进入网络

最低0.47元/天解锁文章

不忘初心，坚持前行

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文学习笔记 - BERT - 1

BERT（Bidirectional Encoder Representations from Transformers）是一种自然语言表示模型。BERT是基于上下文信息的深度双向表示模型，通过预训练，可得到文本的深度双向表示。BERT网络结构BERT的模型结构图如下。BERT的每一层都利用了文本预料的上下文信息。其基本结构是Transformer，将其深度堆叠，通过类似全连接网络...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。