spanBert

最新推荐文章于 2024-04-23 17:17:46 发布

伊直程序媛

最新推荐文章于 2024-04-23 17:17:46 发布

阅读量835

点赞数

分类专栏： nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liunianhuakai/article/details/98479348

版权

1. 对 BERT 模型进行了如下改进：

对随机的邻接分词（span）而非随机的单个词语（token）添加掩膜
通过使用分词边界的表示来预测被添加掩膜的分词的内容，不再依赖分词内单个 token 的表示。
SpanBERT 能够对分词进行更好地表示和预测。该模型和 BERT 在掩膜机制和训练目标上存在差别。首先，SpanBERT 不再对

2. 原理

该模型和 BERT 在掩膜机制和训练目标上存在差别。首先，随机的单个 token 添加掩膜，而是对随机对邻接分词添加掩膜。其次，本文提出了一个新的训练目标 span-boundary objective (SBO) 进行模型训练。通过对分词添加掩膜，作者能够使模型依据其所在语境预测整个分词。另外，SBO 能使模型在边界词中存储其分词级别的信息，使得模型的调优更佳容易。图1展示了模型的原理。
在这里插入图片描述

3. 细节

分词掩膜
对于每一个单词序列 X = (x1, …, xn)，作者通过迭代地采样文本的分词选择单词，直到达到掩膜要求的大小（例如 X 的 15%），并形成 X 的子集 Y。在每次迭代中，作者首先从几何

最低0.47元/天解锁文章

伊直程序媛

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
spanBert

1. 对 BERT 模型进行了如下改进：对随机的邻接分词（span）而非随机的单个词语（token）添加掩膜通过使用分词边界的表示来预测被添加掩膜的分词的内容，不再依赖分词内单个 token 的表示。SpanBERT 能够对分词进行更好地表示和预测。该模型和 BERT 在掩膜机制和训练目标上存在差别。首先，SpanBERT 不再对2. 原理该模型和 BERT 在掩膜机制和训练目标上...
复制链接

扫一扫

专栏目录

伊直程序媛 CSDN认证博客专家 CSDN认证企业博客

码龄8年

31: 原创

59万+: 周排名

144万+: 总排名

1万+: 访问

: 等级

430: 积分

3: 粉丝

8: 获赞

5: 评论

18: 收藏

私信

关注

热门文章

分类专栏

测试 1篇
机器学习 3篇
算法 8篇
LeetCode 12篇
其它 2篇
python学习 3篇
nlp 8篇
GAN 3篇

最新评论

动态规划（python）
From Star.: 自顶向下备忘录法好像有点问题啊，只能解决长度为10以下的问题
word2vec Parameter Learning Explained笔记
东心十: 求帮助：https://ask.csdn.net/questions/1076838
QA论文解读2
伊直程序媛回复 m0_37855283: 没有的
QA论文解读2
m0_37855283: 有代码吗？
QA问答论文笔记
闷声图样: 发现笔记并没有这两张图片来的清晰啊

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。