BERT模型的输入

最新推荐文章于 2024-04-29 07:52:28 发布

小杨算法屋

最新推荐文章于 2024-04-29 07:52:28 发布

阅读量1.8w

点赞数 9

分类专栏： BERT 文章标签： BERT

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yangfengling1023/article/details/91954116

版权

BERT 专栏收录该内容

7 篇文章 4 订阅

订阅专栏

今天简单的介绍一下BERT的模型输入

上图显示的是BERT输入表示
总述：输入嵌入分别是token embeddings, segmentation embeddings 和position embeddings 的总和

BERT最主要的组成部分便是，词向量（token embeddings）、段向量(segment embeddings)、位置向量(position embeddings)

词向量：是模型中关于词最主要的信息
段向量：是因为BERT里面的下一句的预测任务，所以会有两句拼接起来，上句与下句，上句有上句段向量，下句则有下句段向量，也就是图中A与B。此外，句子末尾都有加[SEP]结尾符，两句拼接开头有[CLS]符
位置向量：是因为 Transformer 模型不能记住时序，所以人为加入表示位置的向量
之后这三个向量拼接起来的输入会喂入BERT模型，输出各个位置的表示向量

最近在做基于BERT的阅读理解，所以对BERT进行了进一步的学习，将自己平时的学习的过程进行了简单的记录

小杨算法屋

关注

9
点赞
踩
11

收藏

觉得还不错? 一键收藏
打赏
3
评论
BERT模型的输入

今天简单的介绍一下BERT的模型输入上图显示的是BERT输入表示总述：输入嵌入分别是token embeddings, segmentation embeddings 和position embeddings 的总和BERT最主要的组成部分便是，词向量（token embeddings）、段向量(segment embeddings)、位置向量(position embeddings...
复制链接

扫一扫

专栏目录

小杨算法屋 CSDN认证博客专家 CSDN认证企业博客

码龄9年

113: 原创

4万+: 周排名

124万+: 总排名

108万+: 访问

: 等级

6686: 积分

290: 粉丝

462: 获赞

265: 评论

2094: 收藏

私信

关注

热门文章

分类专栏

leetcode 16篇
推荐算法 1篇
网址收藏 2篇
政治老师的情怀
深度学习 15篇
python 29篇
编码
LSTM
tensorflow 15篇
keras 1篇
数据库 7篇
知识图谱 19篇
java 5篇
linux 4篇
机器学习 8篇
自然语言处理 7篇
BERT 7篇

最新评论

gensim调用doc2vec计算句子的向量
七77.: 你好，是否可以分享数据呢？十分感谢
tf.nn.l2_loss()的用法
沉默的羔羊君: 引用「l2_loss()这个函数的作用是利用L2范数来计算张量的误差值，但是没有开发并且只取L2范数的值的」 “开发”应该是“开方”，写错了吧
知识图谱之知识融合
2301_78004246: 融合知识
数据脱敏python
某疯子: 请问下，脱敏脚本可以求一个吗
LTP：Model not loaded!
Emiya051: 路径也改了，版本也改了，但还是说没加载模型

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小杨算法屋 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。