bert模型快速上手

最新推荐文章于 2024-06-06 14:03:20 发布

唐僧爱吃唐僧肉

最新推荐文章于 2024-06-06 14:03:20 发布

阅读量296

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/znevegiveup1/article/details/113057637

版权

首先，bert模型分为预训练模型和微调(fine-tuing)模型，
bert的输入内容从图中可以看出，bert的对应输入内容分为三个部分。
token embedding用于标注一个句子的对应的标志。
segment embedding用于标注一个句子对应的段落标志，同一个句子标注为统一的 ${E_A}$ ，不同的句子标注为不同的 $E_A$ ， $E_B$ 。
position embedding用于标注单词的位置，以0,1,2,3依次类推。
经过谷歌的预训练之后，得到的参数仍然为token embedding,segment embedding以及position embedding，区别只在于这里的三个对应的参数是使用的谷歌预训练之后的参数，接下来bert模型的微调会根据不同的任务模型进行相应的不同的微调
1.序列分类任务在这里插入图片描述 2.句子分类任务
3.问答任务
Question对应着Token1到Token N,Paragraph也对应着相应的Token1到Token M
4.单个句子标签任务

唐僧爱吃唐僧肉

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
bert模型快速上手

首先，bert模型分为预训练模型和微调(fine-tuing)模型，从图中可以看出，bert的对应输入内容分为三个部分。token embedding用于标注一个句子的对应的标志。segment embedding用于标注一个句子对应的段落标志，同一个句子标注为统一的EA{E_A}EA，不同的句子标注为不同的EAE_AEA，EBE_BEB。position embedding用于标注单词的位置，以0,1,2,3依次类推。经过谷歌的预训练之后，得到的参数仍然为token embedding,s
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。