11月24-25号，来机器之心 AI 论坛深度探讨大模型时代的向量数据库

最新推荐文章于 2024-09-30 21:48:12 发布

Jina AI

最新推荐文章于 2024-09-30 21:48:12 发布

阅读量223

点赞数

文章标签：人工智能

本文链接：https://blog.csdn.net/Jina_AI/article/details/134522470

版权

目前检索增强生成（RAG）已成为当下大模型领域内落地最多也最迫切的领域之一，然而如何用 RAG 系统搭建企业知识库，其技术实现过程中容易走哪些弯路；从数据提取、索引、检索再到生成，如何选择合适的组件并组合以实现最佳的检索性能等等都是技术应用和行业发展的阻碍。

图源公众号：土猛的员外

尤其在 Embedding 向量模型这一关键组件上，当我们探索向量模型的选择时，我们会发现大多数开源向量模型只支持最大 512 长度的输入，这就给长文本的应用场景带来了局限性，尤其是保持语义的完整性上。

我们最新发布的开源模型 jina-embeddings-v2 支持高达 8k 长度的输入，大幅突破了长文本向量表示的瓶颈，不仅能够提升 RAG 场景下大模型回复的准确性，而且特别适合处理长篇文档，比如报告综述、技术文档等业务场景。

更长的输入长度意味着什么呢？

首先，随着现在大型语言模型处理的文本长度越来越长，我们的向量模型也需要尽可能少地切割段落，以减少语义丧失。此外，在 RAG 系统里，Embedding 模块的作用是召回可能包含答案的段落，Rerank 模块再进一步过滤筛选，构成漏斗形的处理流程。支持更长长度的 jina-embeddings-v2 更加适合多文档召回的需求，能够提升大模型回答的准确性和相关性。

因此在面对需要处理长文本输入的场景时，尤其是那些需要广泛信息搜集和理解的情况下，jina-embeddings-v2 提供了一个更加强大和灵活的解决方案选择。不仅能够帮助大型语言模型更加有效地理解和处理长文本的信息，从而在复杂查询中提供更加精确、更加相关的回答。