搜索准确性提升 20%,Jina Reranker 成为 RAG 优化的新标杆!

Jina Reranker 是一款专为提高搜索准确性设计的模型,尤其适用于RAG(检索增强生成)场景。在LlamaIndex RAG、BEIR、MTEB和LoCo等多个评测中取得领先,相比简单RAG系统,命中率提升8%,MRR提升33%。Jina Reranker擅长处理长文本,支持RAG场景,提供高效的二次重排,提升搜索结果的相关性和准确度。
摘要由CSDN通过智能技术生成

在整合大型语言模型(LLM)到业务流程时,企业经常会遇到一些头疼的问题,比如怎样保持数据时效性、避免幻觉现象,以及如何保护数据安全等等。为了解决这些问题,检索增强生成(RAG)技术应运而生,它不仅帮助我们克服了这些挑战,还引领了信息检索的新方向。

虽然 RAG 系统及其科普非常流行,但在实际使用中,我们会发现它“入门易,精通难”。目前,业界的讨论主要集中在如何改进内容提取、文档分块,以及 Embedding 模型等技术,但很少有人提到提升搜索准确度的关键步骤 —— Reranker。

日前,我们正式发布了 Jina Reranker(jina-reranker-v1-base-en),专为提高搜索准确性打造。Jina Reranker 在多个权威测评中屡获领先,实验数据显示,相比简单 RAG 系统,搭载该模型的检索系统命中率提高 8%,MRR 更是飙升 33%。

模型链接: https://jina.ai/reranker/

什么是 Reranker

你可能会问,既然向量检索已经根据相似度给出了初步排序,为什么我们还需要 Reranker 呢?

下表阐述了向量检索和 Reranker 模型之间的主要差异。

  • 20
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要搭建 Jina 搜图,需要遵循以下步骤: 1. 安装 Jina 首先,你需要安装 Jina。你可以通过 pip 安装它: ``` pip install jina ``` 2. 准备数据 接下来,你需要准备一些数据,以便 Jina 可以对其进行搜索。数据可以是图像、文本或任何其他类型的数据。你需要将这些数据存储在一个文件夹中。 3. 编写 Flow 使用 Jina 搜图的核心是创建一个流程(Flow)。流程定义了如何处理和搜索数据。你可以使用 Jina 的 Python API 来定义流程。 例如,要创建一个简单的流程,可以使用以下代码: ```python from jina import Flow f = Flow().add(name='my_encoder', uses='jinahub+docker://MyAwesomeEncoder') ``` 在这个示例中,我们定义了一个流程,它使用名为 `my_encoder` 的编码器,并从 `jinahub` 中下载 Docker 镜像。 4. 运行 Flow 在定义了流程后,你可以使用以下命令运行它: ``` f.run() ``` 这将启动流程,并开始处理和搜索数据。 5. 搜索数据 一旦流程启动,你可以使用 Jina 的客户端 API 来搜索数据。例如,要搜索一个图像,可以使用以下代码: ```python from jina import Client, Document client = Client() image = Document(uri='path/to/image.jpg') response = client.search(inputs=[image]) ``` 在这个示例中,我们定义了一个 Jina 客户端,并搜索了一个名为 `image.jpg` 的图像。 这些是搭建 Jina 搜图的基本步骤。你可以根据自己的需求和数据类型来进一步定制和优化流程。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值