A Deep Relevance Matching Model for Ad-hoc Retrieval
DRMM by Jiafeng Guo, Yixing Fan, Qingyao Ai and W.Bruce Croft for CIKM2016
文章目录
摘要(Abstract)
-
关键词:相关性匹配,语义匹配,神经模型,Ad-hoc检索,排序模型
-
背景:DNN在语音识别、计算机视觉和NLP任务中取得了极大的突破,但是在ad-hoc检索任务并没有取得多少积极的结果。
-
关键:在ad-hoc检索任务和NLP匹配任务中有根本上的不同,在于ad-hoc检索任务主要是关于相关性匹配(relevance matching),而NLP匹配任务更多地是考虑语义匹配(semantic matching)。
一个好的相关性匹配需要正确处理精确匹配信号,查询项重要性和多种多样的匹配需求。
-
本文研究工作:
- 提出深度相关匹配模型(Deep Relevance Matching Model, DRMM)
- 主要组成部分:匹配直方图映射(matching histogram mapping), 前馈匹配网络(feed forward matching network)以及词项门控网络( term gating network),以解决以上上个问题。
-
数据集及表现:
TREC——Robust04 和ClueWeb-09-Cat-B,与传统的检索模型和state-of-the-art深度匹配模型相比,很有竞争力。
1.概述(Introduction)
应用于信息检索的方法:Machine learning methods -> Deep learning models
Machine learning for IR
近年来,机器学习方法已成功应用于信息检索(IR)。通常排序函数(ranking function)可以基于一系列人为定义的特征,对于一个给定的查询和文档对给出相关性分数。然而手工设置的特征存在有以下几个缺点:
- 耗时(time-consuming)
- 不完整(incomplete)
- 过于精确(over-specified)
Deep learning for IR
而另一方面,深度神经网络,作为一个表示学习(representation learning)工具,有能力从训练数据的隐藏结构和抽象的不同层级的特征中发现对任务有用的特征。深度学习目前已经被成功应用于语音设别(speech recognition,2011),计算机视觉(computer vision,2013)以及自然语言处理(Natural Language Processing,NLP,2015),并且已经产生了显着的性能改进。鉴于这些领域深度学习的成功,深度学习似乎应该对IR产生重大影响。然而,到目前为止,关于IR任务的深度模型,特别是ad-hoc 检索任务的积极结果很少。
deep models for ad-hoc retrieval
当将深度模型应用于ad-hoc检索时,检索任务一般会被形式化为两段文本(也就是查询query和文档document)的匹配问题。这种匹配问题通常被认为是通用的,因为它既可以涵盖ad-hoc检索任务,也可以涵盖许多NLP任务,如释义识别(paraphrase identification),问答(question answering,QA)和自动对话(automatic conversation)。
2.Ad-hoc检索作为一个匹配问题
Ad-hoc retrieval ——(formalize)—— > text matching problem
Ad-hoc检索的核心问题是对于一个给定的查询,计算文档的相关性,因此可以被形式化为一个文本匹配问题如下。给定两个文本 T 1 T_{1} T1和 T 2 T_{2} T2 ,衡量它们的相似度得分可以由一个打评分函数(scoring function)基于每个文本的表示计算得分:
m a t c h ( T 1 , T 2 ) = F ( ϕ ( T 1 , ϕ ( T 2 ) ) ) match(T_{1},T_{2})=F(\phi(T_{1},\phi(T_{2}))) match(T1,T2)=F(ϕ(T1