【论文阅读】Multi-View Document Representation Learning for Open-Domain Dense Retrieval

最新推荐文章于 2024-10-16 10:02:51 发布

nlp菜菜

最新推荐文章于 2024-10-16 10:02:51 发布

阅读量735

点赞数

分类专栏： nlp学习中文章标签：论文阅读深度学习人工智能

本文链接：https://blog.csdn.net/vegetable_me/article/details/127467900

版权

nlp学习中专栏收录该内容

4 篇文章 1 订阅

订阅专栏

论文阅读1：Multi-View Document Representation Learning for Open-Domain Dense Retrieval

论文来源：ACL2022
论文地址：https://arxiv.org/abs/2203.08372

领域：检索，密集检索(Dense Retrieval)，初次检索，文档表示

做法简介：用多个embeddings表示一个文档；设置局部损失让embeddings避免坍缩成1个，以改善文档表示

阅读前的碎碎念

接下来详细解释一下论文的一些点，因为本人也是科研小白，所以可能有的东西不是很了解，说错的望各位海涵。

主要思路

这部分主要介绍作者考虑了哪些内容，包括如何输出文档表示、如何训练模型（当然包括数据集的简单介绍）和一些其他的小细节。

初次检索相关

1.检索体系结构

论文中列举了检索的几种模型体系
用于检索/重新排序的不同模型体系结构的对比
作者最后选择了Bi-encoder的形式做密集检索，这种方式可以由ANN（近似最近邻）支持，好处是查询很快

2.如何计算查询和文档的相关度

计算评分的方式则是采用相似度函数代替查询和文档的相关性
相似度度量函数
相似度函数可以取向量相似度、欧氏距离等等

本文考虑了多个评分（可以结合下图看）
全局-局部损失多视图表示学习的一般框架。灰色块表示不同层次的分数类别。
其中，个人分数由查询表示和文档每个句子的表示计算，用它们的内积表示；聚合分数取这些相似度中最大的那个作为表示（max-pooler）
聚合分数的计算

小小的总结

总之这部分主要说的是，我们是先用向量表示句子或者查询，然后再通过函数计算相似性的，这很自然。

模型相关

向量表示

1.采用模型输出的哪个部分作为向量表示？

毫无疑问采用了BERT。
但并不是采用[CLS]输出的向量或者mean_pooling，而是采用了全新的特殊标记[VIE]，这些标记将添加在文本前，与文本一同输入模型。
这些标记将会随机初始化，为了不影响句子顺序，它们的位置编码将被统一设置成0
模型输入
最后使用特殊标记的last_hidden_state的输出的作为文本表示