Bert的NSP任务的loss原理

最新推荐文章于 2024-07-12 16:55:56 发布

zcc_0015

最新推荐文章于 2024-07-12 16:55:56 发布

阅读量1.1k

点赞数

文章标签： bert 人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zcc_0015/article/details/130039775

版权

Bert的NSP任务是预测上句和下句的关系。对一个句子的表征可以用CLS的embedding，bert的NSP任务，NSP 是一个预测两段文本是否在原文本中连续出现的二元分类损失。NSP 是一种二进制分类损失，用于预测原始文本中是否有两个片段连续出现，如下所示：通过从训练语料库中获取连续片段来创建正样本；通过将来自不同文档的句段配对而创建负样本；正样本和负样本均以相同的概率 (概率各自为 0.5)采样。NSP任务在单个任务中融合了主题预测和连贯性预测，同一篇文档里的句子，更侧重是一个主题，前后两个句子的连贯更有利于连贯性的学习，不同文章中的句子很大概率表达的是不同的主题，学习起来难度比较小。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Bert的NSP任务的loss原理

对一个句子的表征可以用CLS的embedding，bert的NSP任务，NSP 是一个预测两段文本是否在原文本中连续出现的二元分类损失。NSP 是一种二进制分类损失，用于预测原始文本中是否有两个片段连续出现，如下所示：通过从训练语料库中。正样本和负样本均以相同的概率 (概率各自为 0.5)采样。NSP任务在单个任务中融合了主题预测和连贯性预测，同一篇文档里的句子，更侧重是一个主题，前后两个句子的连贯更有利于连贯性的学习，不同文章中的句子很大概率表达的是不同的主题，学习起来难度比较小。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。