概述笔记 TREC 2020|OVERVIEW OF THE TREC 2020 DEEP LEARNING TRACK

1 介绍

概述题目:OVERVIEW OF THE TREC 2020 DEEP LEARNING TRACK
概述来源:TREC 2020
概述链接:https://trec.nist.gov/pubs/trec29/papers/OVERVIEW.DL.pdf

深度学习的方法已经在语音识别和CV领域取得了显著的性能提升,但在信息检索中,并没有显著的性能提升。TREC Deep Learning Track的主要目标是研究在大的训练数据区域中的信息检索,以确定哪种检索方法效果最好。

2 任务定义

分为两个任务:文档检索和段落检索

2.1 文档检索

文档检索任务分为完整检索和top-100重排。

  • 在完整检索子任务中,将根据文档与查询的相关性对文档进行排序,可以从提供的完整文档集合中检索文档。此子任务对端到端检索场景进行建模。
  • 在重排子任务中,给出100个文档的初始排名,对这些文档进行排序。

评测标准:

  • 完成相关:该文档专用于查询,值得成为搜索引擎中的top结果
  • 高度相关:文档提供大量的信息与查询有关
  • 相关:文档提供一些信息与查询有关(可能很少)
  • 不相关: 文档对查询不提供有用的信息

2.2 段落检索

与文档检索类似,分为完整检索和top-1000重排。

  • 在完整检索子任务中,给定一个查询,要求参与者根据他们估计的包含问题答案的可能性,从完整集合中检索段落的排序列表。对于这项端到端检索任务,参与者每次查询最多可以提交1000篇段落。
  • 在重排子任务中,对每个查询提供给参与者1000篇段落,进行重新排名。
    评测标准也类似。

3 数据集

基于人工相关性评估的数据集MS MARCO,同时发布一个大规模点击数据集ORCAS,来源于主流搜索引擎的日志。

4 结果分析

方法分为三类:

  • nnlm:使用大规模预训练语言模型
  • nn:使用深度学习的方法或者词向量
  • trad:传统信息检索方法

评测指标为NDCG@10(Normalized Discounted Cumulative Gain)、Average Precision (AP)和Reciprocal Rank (RR)。

4.1 深度学习与传统方法的对比

可以发现在b图中三中方法的差距是更大,一个原因是在短文本中,查询和相关结果之间的词汇不匹配的概率是更大的。另一个原因是对于段落任务,尽管没有NIST的测试标签,但是已经有了一个公共排行榜在这里插入图片描述
在文档检索任务中,最好的nnlm模型比最好的传统模型在38个(共45个,84%)测试查询上表现好。在段落检索中的结果也类似。

4.2 端到端检索与重排的对比

结果如下图,具体来说,对于文档检索任务,最佳的完整检索比最佳重排高 5%的NDCG@10; 而对于段落检索任务,与最佳的重排相比,最佳的完整检索的性能稍差(NDCG@10低0.3%)
在这里插入图片描述

4.3 ORCAS数据的影响

使用ORCAS数据集会提高NDCG@10的性能,最大的增加是在 NDCG@10大约0.0513%。

4.4 NIST标签与稀疏的MS MARCO标签的对比

NIST官方标签更全面,涵盖每个查询的大量结果,并在NIST以四分制进行标记。MS MARCO中对于一个查询通常有一个positive result。
下图展示了一致性,深度学习方法是高的,对于传统方法的文档检索一致性接近为0。
在这里插入图片描述

如下图,使用ORCAS数据表现得更好在MS MARCO评测设置上。ORCAS数据集和MS MARCO标签之间的相似性似乎是两个评估结果不匹配的原因之一。
在这里插入图片描述

5 总结

  • 虽然使用ORCAS数据集似乎有助于提高系统的性能,但没有必要使用 ORCAS 数据来实现最高的 NDCG@10。
  • 重拍的方法和端到端检索的方法没有大的差距。
  • 使用两种评测标签,在段落检索任务中一致性较高,文档检索任务中一致性较低。
  • 使用ORCAS数据集是低相关性的一个理由。
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 为了下载TREC06C数据集,您可以按照以下步骤进行操作: 1. 首先,您需要打开网页浏览器并访问TREC官方网站。您可以在搜索引擎中输入"TREC官方网站"来找到该网站。 2. 在TREC官方网站上,您可以找到与TREC06C数据集相关的信息和资源。您可以使用网站上的搜索功能,搜索TREC06C数据集。 3. 在搜索结果中,您可能会看到有关TREC06C数据集的页面或链接。请点击相关链接以获取进一步的信息。 4. 在相关页面上,您可能会找到关于TREC06C数据集的描述、下载链接或访问权限的说明。请根据页面上的引导,选择适合您的下载选项。 5. 请注意,有些数据集可能需要您注册或登录才能进行下载。如果需要注册,请按照页面上的要求进行注册。 6. 一旦您找到适合的下载选项并完成相关步骤,您可以点击下载链接或按照页面上的说明进行下载。 7. 下载时间可能会根据您的网络连接速度和数据集的大小而有所不同。请耐心等待下载完成。 8. 下载完成后,您可以查看下载的文件,并根据需要进行相应的数据分析或研究。 希望以上信息对您有所帮助,祝您成功下载TREC06C数据集! ### 回答2: TREC06C是一个公开的数据集,用于信息检索和文本分类的研究和评估。它是2006年美国国家标准技术研究所(NIST)举办的TREC竞赛中使用的数据集。 要下载TREC06C数据集,首先需要在NIST的TREC网站上注册一个账号。注册完成后,根据网站上的指引,选择TREC06C数据集并查找下载链接。 在下载链接中,可能会有不同格式的数据集可供选择,如原始文本、索引文件或预处理的数据等。根据自己的需要选择合适的数据格式并下载。 一旦下载完成,就可以开始使用TREC06C数据集进行研究和评估了。可以根据数据集的文档来了解数据的结构和标记方式,这有助于更好地理解和处理数据集。 在进行研究和评估过程中,可以使用TREC06C数据集来构建文本分类模型、评估信息检索算法的性能,或者进行其他相关的任务。可以根据自己的具体需求和研究目标来利用数据集,并按照科研的规范进行实验和分析。 总之,下载TREC06C数据集需要在NIST的TREC网站上注册账号,找到对应的下载链接,并选择合适的数据格式进行下载。通过合理利用数据集进行研究和评估,可以提高信息检索和文本分类等领域的研究成果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hlee-top

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值