PACRR: A Position-Aware Neural IR Model for Relevance Matching阅读笔记

前言

今天介绍两个模型——PACRR和Co-PACRR。

PACRR模型

模型主要分为两部分:

  1. 关联匹配组件,将每个query-document对转变为相似矩阵;
  2. 一个深度网络,以相似矩阵作为输入,生成query-document关联分数。

在这里插入图片描述

关联匹配

首先利用query-document相似矩阵对query-document关联匹配进行编码。
相似矩阵利用query和document的词向量余弦距离表示。

之后利用卷积操作提取n-gram特征。

预处理
对于query,将所有条目都padding到query集最长长度。
对于document有以下两种策略:

  1. PACRR-firstk
    就是设置超参文章长度k,截长补短。
  2. PACRR-kwindow
    设置一个超参n,表示每个文章片段(text snippets)的最大长度,也就是大小为n的窗口。
    计算每个窗口的平均相似度。这部分没看太懂,准备看看源码,看懂了回来补充。

深度检索模型

得到query-document相似矩阵之后,以此作为输入,利用卷积网络提取特征。
之后,利用max-pooling抽取strongest similarity cues。
最后,再利用rnn对特征进行聚合来预测全局query-document相关分数。

损失函数

pairwise max margin loss
在这里插入图片描述

实验

训练集的选取

使用2009-2014 TREC Web Track数据集。

TREC将文档分为junk pages (Junk), nonrelevance (NRel), relevance (Rel), high relevance (HRel), key pages (Key) and navigational pages (Nav)这6级。

在选取三元组时,将标签高于Rel的文档作为“高相关“文档,剩下的相关文档分到“相关”这一组。为了选取每一个三元组,抽取一个与训练集中组内文档数量成比例的概率相关的组作为样本组,然后随机抽取一个文档作为正样本 d + d^+ d+

如果选中的组是“高相关”文档组,则从“相关”组随机选取一个作为负样本 d − d^-

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值