2023 年 10 月 30 号,Jina AI 正式发布了 jina-embeddings-v2,是全球首个唯一支持 8K(8192)输入长度的开源向量大模型,今天,我们趁热打铁,为企业和开发者提供 Embedding API,即插即用!
借助该 API,开发者可以用于改进检索增强生成 (RAG) 系统的效果,用以解决大型语言模型的上下文长度限制、幻觉问题和知识注入问题。
现在我们提供了其 英文版本 的免费 API 试用方案:
新用户无需注册,打开网页 https://jina.ai/embeddings/,即刻免费获取 API 密钥,该密钥包含 10,000 tokens 的使用额度。
现有模型的限制
现有开源模型的长度限制:当前主流的开源向量模型,如 BERT 和 GPT 系列,受限于最多 512 个 token 的输入长度限制。这意味着长文本必须被截断或分割,从而破坏了文本的完整性和内在的引