优化密集检索模型训练：利用硬负样本提升性能

最新推荐文章于 2025-02-11 14:11:25 发布

孟振优Harvester

最新推荐文章于 2025-02-11 14:11:25 发布

阅读量777

点赞数 24

本文链接：https://blog.csdn.net/gitblog_00028/article/details/142199622

版权

优化密集检索模型训练：利用硬负样本提升性能

DRhard SIGIR'21: Optimizing DR with hard negatives and achieving SOTA first-stage retrieval performance on TREC DL Track. 项目地址: https://gitcode.com/gh_mirrors/dr/DRhard

项目介绍

在信息检索领域，密集检索模型的训练一直是研究的热点。本项目由Jingtao Zhan等人开发，旨在通过引入硬负样本（Hard Negatives）来优化密集检索模型的训练过程。项目提供了代码、检索结果以及训练好的模型，基于他们在SIGIR上的全论文《Optimizing Dense Retrieval Model Training with Hard Negatives》。此外，该项目还为WSDM'22和CIKM'21上的两篇论文提供了训练基础，分别提出了RepCONC和JPQ算法，显著提升了检索的效率和效果。

项目技术分析

本项目主要提出了两种算法：STAR（Sampling and Training with Adaptive Regularization）和ADORE（Adaptive Document Order Regularization）。这两种算法通过引入硬负样本来优化查询编码器和文档编码器的训练过程，从而提升检索模型的性能。具体来说，STAR算法通过自适应正则化来训练模型，而ADORE算法则通过调整文档顺序来进一步优化查询编码器。这两种算法不仅提高了检索的准确性，还显著提升了训练效率。