PaddleNLP系列1-基础知识

最新推荐文章于 2024-07-19 03:44:02 发布

愚昧之山绝望之谷开悟之坡

最新推荐文章于 2024-07-19 03:44:02 发布

阅读量672

点赞数

分类专栏：基于深度学习的自然语言处理文章标签：深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_15821487/article/details/126975282

版权

基于深度学习的自然语言处理专栏收录该内容

28 篇文章 4 订阅

订阅专栏

单塔，query和title进行拼接输入到同一个模型

单塔 Point-wise 范式，不引入负样本

基于单塔 Point-wise 范式的语义匹配模型 ernie_matching: 模型精度高、计算复杂度高, 适合直接进行语义匹配 2 分类的应用场景。

单塔 Pair-wise 范式，引入同一批次的负样本，正例更近，负例更远

基于单塔 Pair-wise 范式的语义匹配模型 ernie_matching: 模型精度高、计算复杂度高, 对文本相似度大小的序关系建模能力更强，适合将相似度特征作为上层排序模块输入特征的应用场景。

双塔，query和title不拼接，分布单独输入到同一个模型

双塔 Point-wise 范式，不引入负样本

基于双塔 Point-wise 范式的语义匹配模型 SimNet 和 Sentence Transformers, 这 2 种方案计算效率更高，适合对延时要求高、根据语义相似度进行粗排的应用场景。
在这里插入图片描述

双塔 Pair-wise 范式，引入同一批次的负样本，正例更近，负例更远

Baseline 46.99 60.84 标准 pair-wise 训练范式，通过随机采样产生负样本
In-batch negatives 51.20(+4.21) 67.24(+6.4) 在 Batch 内同时使用 batch_size 个负样本进行训练
HardestNeg 50.22(+3.23) 65.17(+4.33)
在 Batch 内先挖掘最难负样本，然后进行 pair-wise 训练
在这里插入图片描述

BERT的输出，本身就有归一化

在这里插入图片描述

愚昧之山绝望之谷开悟之坡

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。