A Pseudo-relevance feedback framework combining relevance matching...泛读笔记

题目:A Pseudo-relevance feedback framework combining relevance matching and semantic matching for information retrieval
来源:2019,Elsevier,Information Processing and Management
地址:https://doi.org/10.1016/j.ipm.2020.102342

Title

一种结合关联匹配和语义匹配的信息检索伪关联反馈框架

Motivation

伪关联反馈(PRF)是解决查询意图与查询表示不匹配的一种常见方法。目前大多数PRF方法仅从用于对反馈文档排序的词的角度考虑相关性匹配,因此可能导致查询表示和文档表示之间存在语义差距。
为什么查询意图与查询表示不匹配:
1)用户的查询基于知识积累的,而计算机没有相关的积累,导致计算机很难理解用户的实际意图;
2)实际检索过程中,用户不会明确表达一些词,而是隐藏在所提问的句子中;
1)2)导致query和documents的语义偏差,在PRF中通过查询扩展可以有效地提高检索性能;
相关性匹配的缺点:
仅仅依赖词等表面特征,没有将query和document的语义信息视为计算相关性的重要指标;
语义匹配的缺点:
仅仅考虑query和document的语义匹配,经常忽略其它重要信息,如精确的匹配信号、query重要词等;

Idea

提出一种结合相关匹配和语义匹配的PRF框架,以提高反馈文档的质量,然后使用不同的PRF方法对反馈文档进行质量评估

Method

在这里插入图片描述
1)第一轮检索:
输入:Query
处理:使用BERT对BM25检索出来的前N个文档进行重排序
输出:Reranked N Documents
2)查询扩展:
输入:Reranked N Documents
处理:结合常见的PRF从第一轮检索的结果中提取扩展词,并为第二轮检索生成新的查询
输出:New Query
3)第二轮检索;
输入:New Query
处理:检索
输出:Ranked Documents

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值