SIGIR2019|基于BERT的深度学习模型在信息检索中的应用(已开源)

最新推荐文章于 2024-08-01 12:30:00 发布

frank_hetest

最新推荐文章于 2024-08-01 12:30:00 发布

阅读量4.2k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hestendelin/article/details/103856019

版权

该研究探讨了BERT如何改进信息检索中的文本理解，通过利用BERT的语境化文本表示，提高了查询和文档相关性的捕捉能力。实验结果显示，BERT模型在长查询和理解语言结构方面表现优越，尤其在有限训练数据情况下对相关性搜索任务有益。此外，停用词和标点符号在理解query中也发挥重要作用。

摘要由CSDN通过智能技术生成

Deeper Text Understanding for IR with Contextual Neural Language Modeling

Zhuyun Dai, Jamie Callan

Carnegie Mellon University

https://arxiv.org/pdf/1905.09217.pdf

神经网络能够自动学习复杂语言模式和查询文档的关系。神经信息检索模型在学习查询文档相关的模式中已经取得了不错的效果，但是目前很少研究人员着重在理解查询的文本内容或者理解文档的内容。

这篇文章研究了如何利用最近提出的语境神经语言模型，BERT，进而可以对信息检索中的文本理解更加深透。

实验结果表明，BERT模型所得语境文本表示相对传统词嵌入更加有效。跟词包检索模型相比，语境语言模型可以更好地利用语言结构，在自然语言的查询中带来大幅提升。将文本理解能力和搜索知识结合起来可以得到增强的预训练BERT模型，该模型在训练数据有限的情况下对相关性搜索任务比较有利。

语境语言模型的特点在于

BERT的优势在于

实验结果表明，比较长的query效果优于短关键词query的效果，并且停用词以及标点符号通过定义语法结构和单词之间的依赖，对于理解query可以起到比较关键的作用。

BERT用于句对分类的结构图示如下

整体流程如下

数据集信息及处理方式描述如下

几种参与对比的方法如下

最低0.47元/天解锁文章

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。