摘要:
本文提出了双实体神经排序模型(EDRM),该模型将知识图谱引入神经搜索系统。EDRM用词和实体表示查询和文档。来自知识图谱的语义被集成在它的实体的分布式表示中,而排名则是通过基于交互的神经排名网络进行的。这两个组件是端到端学习的,这使EDRM自然地成为面向实体的搜索和神经信息检索的组合。我们在商业搜索日志上的实验证明了EDRM的有效性。我们的分析表明,知识图谱的语义显着提高了神经排序模型的泛化能力。
面向实体的搜索和神经IR从两个方面推动了搜索引擎的发展。面向实体的搜索结合了来自实体的人类知识和知识图语义。
介绍:
EDRM结合了面向实体的搜索和基于交互的神经IR。它将知识图语义带入了神经网络IR,并通过神经网络增强了面向实体的搜索。
神经性的优势之一是可以端对端学习EDRM。给定大量来自商业搜索日志的用户反馈,就可以结合EDRM中的查询文档相关性建模来学习知识图语义与神经排名的集成。它提供了一种方便的数据驱动方式,可以利用神经IR中的外部语义。
我们在Sogou查询日志和CN DBpedia上进行的实验证明了神经模型中实体和语义的有效性。EDRM明显优于基于单词交互的神经排名模型K-NRM,证实了实体在丰富基于单词的排名方面的优势。
我们的分析进一步揭示了EDRM泛化能力的来源:知识图谱的语义。如果仅将实体视为