自然语言处理 - Transformer 到 BERT

最新推荐文章于 2024-05-06 14:57:30 发布

愉贵妃珂里叶特氏海兰

最新推荐文章于 2024-05-06 14:57:30 发布

阅读量619

点赞数

分类专栏：自然语言处理与深度学习文章标签：深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41332009/article/details/114489895

版权

先修知识：
self-attention 到 Transformer:https://blog.csdn.net/weixin_41332009/article/details/114441708

1. BERT简介

Bidirection： BERT的整个模型结构是双向的。
Encoder： 是一种编码器，BERT只是用到了Transformer的Encoder部分。
Representation： 做词的表征。
Transformer： Transformer是BERT的核心内部元素。

BERT的基本思想和 word2vec 中的 CBOW 是一样的，都是给定context，来预测下一个词。BERT的结构是双向结构。

2. BERT的模型结构

BERT的模型结构是Seq2Seq，核心是Transformer encoder。
在这里插入图片描述

2.1 Bert模型的输入

BERT的输入包含三个部分：Token Embedding、Segment Embedding、Position Embedding。这三个部分在整个过程中是可以学习的。

最低0.47元/天解锁文章

愉贵妃珂里叶特氏海兰

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
自然语言处理 - Transformer 到 BERT

先修知识：self-attention 到 Transformer:https://blog.csdn.net/weixin_41332009/article/details/1144417081. BERT简介Bidirection： BERT的整个模型结构是双向的。Encoder：是一种编码器，BERT只是用到了Transformer的Encoder部分。Representation：做词的表征。Transformer： Transformer是BERT的核心内部元素。BERT的基本思
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。