Bi-Encoder vs. Cross-Encoder

Bi-Encoder与Cross-Encoder对比及选择

原创

已于 2025-01-07 16:27:22 修改 · 1.3k 阅读

15 ·

CC 4.0 BY-SA版权

文章标签：

#Encoder

于 2025-01-07 16:17:22 首次发布

Bi-Encoder vs. Cross-Encoder

Bi-Encoder 和 Cross-Encoder 是两种常见的模型架构，主要用于自然语言处理（NLP）中的文本匹配、问答、检索等任务。它们的主要区别在于如何处理输入文本以及计算相似度的方式。

1. Bi-Encoder（双编码器）

1.1 工作原理

双编码器：Bi-Encoder 使用两个独立的编码器分别对输入的两个文本（如查询和文档）进行编码。

独立编码：两个文本分别通过编码器（如 BERT）生成各自的向量表示。

相似度计算：通过计算两个向量的点积、余弦相似度等方式，得到文本之间的相似度分数。

1.2 优点

高效：由于两个文本的编码是独立的，可以预先计算并缓存文档的向量表示，适合大规模检索任务。

适合在线服务：在检索系统中，查询向量可以与预先计算的文档向量快速匹配。

1.3 缺点

信息隔离：两个文本在编码过程中没有交互，可能丢失一些细粒度的语义信息。

性能限制：在某些需要精确匹配的任务中，性能可能不如 Cross-Encoder。

1.4 应用场景

大规模检索：如搜索引擎、文档检索。

语义相似度计算：如句子相似度、问答匹配。

1.5 代码示例

复制
from sentence_transformers import</

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

撑一把纸伞.

关注关注

5
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

Cross-Encoder（交叉编码器）和 Bi-Encoder（双编码器）

Cachel Wood的博客

05-30

431

摘要： Cross-Encoder（交叉编码器）和Bi-Encoder（双编码器）是NLP中处理文本匹配的两种模型。Bi-Encoder通过独立编码双文本生成向量后计算相似度，适合大规模检索（高效但精度较低）；Cross-Encoder联合编码双文本，利用交叉注意力捕获细粒度交互，精度高但计算成本大，适用于精细匹配。实际应用中常结合两者：先用Bi-Encoder快速筛选候选，再用Cross-Encoder重排序以平衡效率与精度。

【NAACL 2021】AugSBERT：用于改进成对句子评分任务的 Bi-encoder 数据增强方法

06-21

1241

论文地址：https://arxiv.org/abs/2010.08240目前，最先进的 NLP 架构模型通常重用在 Wikipedia 和 Toronto Books Corpus 等大型文本语料库上预训练的 BERT 模型作为基线。通过对深度预训练的 BERT 进行微调，发明了许多替代架构，例如 DeBERT、RetriBERT、RoBERTa ……它们对各种语言理解任务的基准进行了实质性改进。在 NLP 中的常见任务中，成对句子评分在信息检索、问答、重复问题检测或聚类等方面有广泛的应用。

参与评论您还未登录，请先登录后发表或查看评论

Bi-Encoder 与 Cross-Encoder 全解析：原理、对比与实战模型推荐

Harry的博客

06-27

2329

Bi-Encoder 是一种将 Query 和 Document 分别编码为向量的架构，通常用于大规模语义检索任务。Cross-Encoder 将 Query 和 Document 拼接后，一起输入到一个 Transformer 模型中，进行整体编码与匹配打分。应用场景推荐使用方式大规模语义检索Bi-Encoder + 向量数据库小规模高质量排序高性能企业RAG系统。

预训练模型语义相似性计算(六)--cross-encoder

choose_c的博客

04-22

7037

前面讲的各个语义相似性计算的模型，基本都是双塔的结构。双塔结构主要优点是相似性计算快速，这里指的快速不是模型单个数据的推理速度，而是在大量问句场景下的计算，比如相似问句的召回场景。因为双塔模型得到的其实是单个问句的表示，相似性的计算只是在最后做了简单的计算，最耗时的问句表示操作可以离线完成。而cross-encoder是在模型输入时进行了拼接输入，这样两个问句进行更深层的交互，相似句任务直接在模型中完成，而不单单是问句的语义表示模型。所以cross-encoder的相似计算效果也要明显优于双...

sentence-transformers交叉编码器：CrossEncoder架构与排序任务

热门推荐

让学习成为一种习惯 ( 韩曙亮の技术博客 )

03-10

1万+

一、文本相似度排序 1、向量数据库查询弊端 2、二次排序的必要性 2、相似度排序模型 3、Bi-Encoder 双编码器 4、Cross-Encoder 交叉编码器 5、结合使用 6、Bi-Encoder 双编码器与 Cross-Encoder 交叉编码器对比二、Bi-Encoder 双编码器用法实例三、Cross-Encoder 交叉编码器用法实例 1、Cross-Encoder 交叉编码器实现原理 4、Cross-Encoder 交叉编码器代码示例

Bi-Encoder vs Cross-Encoder

Turbo.AI,专注AI工程化

04-27

1562

维度Bi-Encoder编码方式查询和文档独立编码查询和文档联合编码计算效率高，适合大规模检索低，适合小规模精细排序语义交互较弱强，捕捉细粒度上下文关系适用场景大规模语义搜索、实时响应精准排序、重排序、语义匹配计算资源需求低高结合实际需求，合理选择或结合使用Bi-Encoder和Cross-Encoder，能够在效率与准确率之间取得最佳平衡。以上内容基于多篇权威资料总结整理，并结合官方示例代码进行演示，便于理解和应用。

NLP Bi-Encoder和Re-ranker(引流：Cross Encoder 交叉编码器 ReRanker)

duoyasong5907的博客

10-19

2805

如何将BI和Cross Encoder配合使用？可以先用BI-Encoder选出top 100个候选项，再用Cross-Encoder挑选最佳选项。

探索响应选择新维度：Bi-Encoder、Poly-Encoder与Cross-Encoder的开源实现

gitblog_00100的博客

06-09

794

探索响应选择新维度：Bi-Encoder、Poly-Encoder与Cross-Encoder的开源实现在人工智能领域，特别是在自然语言处理（NLP）中，有效的对话系统是构建智能化交互的关键。本文将向您隆重介绍一个精彩开源项目——基于Bi-Encoder, Poly-Encoder, 和Cross-Encoder的响应选择任务框架。这个项目源于对论文《Poly-encoders: Transfo...

（四）基于文本的QA问答系统——biencoder方法

Simonsdu的博客

04-09

1386

biencoder方法加载预训练模型我们使用Muennighoff/SGPT-125M-weightedmean-msmarco-specb-bitfit预训练模型。 tokenizer = AutoTokenizer.from_pretrained("Muennighoff/SGPT-125M-weightedmean-msmarco-specb-bitfit",cache_dir = './SGPT-125M-weightedmean-msmarco-specb-bitfit') model = A

论文阅读：Bi-encoder Transformer Network for Mandarin-English Code-switching Speech Recognition using Mix

qq_23126625的博客

03-24

893

语音识别阅读笔记-Bi-encoder Transformer Network for Mandarin-English Code-switching Speech Recognition using Mixture of Experts (interspeech 2020) 下载链接： http://www.interspeech2020.org/index.php?m=content&c=index&a=show&catid=413&id=1277 主要思想：

双编码器与交叉编码器检索器

weixin_43156294的博客

03-04

1382

检索器是信息检索系统中的核心组件，其基本功能是根据用户输入的查询信息，从大量的数据集合中快速、准确地找到与之相关的信息资源。

Bert (Bi-directional Encoder Representations from Transformers) Pytorch 源码解读（三）

ZJRN1027的博客

01-13

832

前言 Bert (Bi-directional Encoder Representations from Transformers) Pytorch 版本源码解读的第三篇，也是最后一部分。这一部分为源码中， wiki_dataset.py 文件中的内容，主要实现了 Bert 模型预训练时，数据的预处理工作。读完这一部分源码有助于更好的理解模型的输入部分的数据是如何构造的。 Bert 源码解读：...

【自然语言处理】【向量表示】AugSBERT：改善用于成对句子评分任务的Bi-Encoders的数据增强方法

bqw的博客

07-24

1297

句子对评分任务在NLP\text{NLP}NLP中被广泛使用。其可以被用于信息检索、问答、重复问题检测和聚类。对于许多包含句子对评分任务达到sota的方法是使用BERTBERT。两个句子被传递至网络中，并且注意力机制被应用在所有的输入tokens中。这种两个句子被同时传递至网络中的方法称为。的一个缺点是对于许多任务来说计算量太大。例如，对10000个句子进行聚类，需要n2n^2n2的复杂度，使用BERTBERT的话需要65个小时。端到端的信息检索也不太可能使用这样的的质量。。......

Bert (Bi-directional Encoder Representations from Transformers) Pytorch 源码解读（二）

ZJRN1027的博客

01-08

1045

前言这里是 Bert(Bi-directional Encoder Representations from Transformers) 源码解读的第二部分，第一部分主要介绍了 bert_model.py 文件中， bert 模型的定义。而第二部分为 BERT_Training.py 文件，该部分源码主要实现了 Bert 模型的预训练工作。 Bert 源码解读： 1. 模型结构源码：be...

Cross-Encoder实现文本匹配(重排序模型)

日积月累，天道酬勤

09-10

3352

本文介绍了CrossEncoder重排序模型的原理和代码实践。

论文笔记之《Pre-trained Language Model for Web-scale Retrieval in Baidu Search》

Transfer

08-02

1657

预训练语言模型在百度搜索中的应用

Bi-Encoder

07-10

### Bi-Encoder技术及其应用 #### 原理 Bi-Encoder是一种文本对比模型架构，其核心思想是分别独立编码查询和文档，生成各自的向量表示。通过将查询和文档分别映射到一个共享的语义空间中，Bi-Encoder可以快速计算两者的相似度，通常使用余弦相似度作为衡量标准。这种设计使得Bi-Encoder在处理大规模数据时具有较高的效率，因为它支持预先计算并存储文档的向量表示[^2]。 #### 应用场景 Bi-Encoder因其高效性而广泛应用于需要快速响应的场景，例如大规模检索、向量数据库索引等任务。此外，Bi-Encoder也被用于构建高效的自然语言处理系统，如信息检索、语义匹配以及问答系统等领域。具体来说，它可以用来实现快速筛选候选文档的功能，在第一阶段帮助减少后续处理的数据量[^1]。 #### 自然语言处理中的作用在自然语言处理（NLP）领域，Bi-Encoder与Cross-Encoder形成互补关系。由于Bi-Encoder能够提供快速但相对粗糙的语义交互结果，它常被用作多阶段处理流程的第一步；而在第二阶段，则会利用Cross-Encoder对由Bi-Encoder选出的候选文档进行更精确的重排序[^1]。这样的组合不仅提高了整体系统的效率，还保证了最终结果的质量。以下是一个简单的Python代码示例，展示了如何使用Hugging Face Transformers库来创建一个基于Transformer的Bi-Encoder模型： ```python from transformers import AutoTokenizer, AutoModelForSequenceClassification import torch # 加载预训练的双编码器模型和分词器 model_name = "BAAI/bge-large-zh-v1.5" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForSequenceClassification.from_pretrained(model_name) def encode(texts): inputs = tokenizer(texts, padding=True, truncation=True, return_tensors="pt") with torch.no_grad(): outputs = model(**inputs) return outputs.logits # 示例文本 queries = ["这是一个查询"] documents = ["这是一篇文档", "这是另一篇不同的文档"] # 编码查询和文档 query_embeddings = encode(queries) document_embeddings = encode(documents) # 计算余弦相似度 similarities = torch.nn.functional.cosine_similarity(query_embeddings.unsqueeze(1), document_embeddings.unsqueeze(0), dim=2) print(similarities) ``` 这段代码首先加载了一个预训练的双编码器模型及其对应的分词器，然后定义了一个函数`encode`来处理输入文本并生成相应的嵌入向量。最后，通过计算查询和文档之间的余弦相似度来评估它们的相关性。