Bert的NSP任务的loss原理

        Bert的NSP任务是预测上句和下句的关系。对一个句子的表征可以用CLS的embedding,bert的NSP任务,NSP 是一个预测两段文本是否在原文本中连续出现的二元分类损失。NSP 是一种二进制分类损失,用于预测原始文本中是否有两个片段连续出现,如下所示:通过从训练语料库中获取连续片段来创建正样本;通过将来自不同文档的句段配对而创建负样本; 正样本和负样本均以相同的概率 (概率各自为 0.5)采样。NSP任务在单个任务中融合了主题预测和连贯性预测,同一篇文档里的句子,更侧重是一个主题,前后两个句子的连贯更有利于连贯性的学习,不同文章中的句子很大概率表达的是不同的主题,学习起来难度比较小。

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值