https://arxiv.org/pdf/2002.03932.pdf
Google的paper(How to pretrain?),主要是讲怎么样更好的设计pretrain任务,用于问答任务。
https://arxiv.org/pdf/2004.12832.pdf
Stanford的paper(How to late fusion?),主要是讲怎么样更好的让query和doc进行late fusion,用于召回侧&&粗排?相比双塔dssm模型,recall更优;相比交互式dssm模型,效率上更优。此外,召回侧可以使用faiss超大规模检索,用于工业界的搜索/推荐等系统。
https://arxiv.org/pdf/1905.01969.pdf
Facebook的paper(How to late fusion?),和上个paper的目的一致,怎么样进行late fusion,提高检索的效率,