亮点提前看
双语模型支持:继 8k 向量模型在 Huggingface 突破百万下载后,Jina Embeddings 系列又开源了中英、英德双语 8k 向量模型,分别为 jina-embeddings-v2-zh 和 jina-embeddings-v2-de。
百万 Token 随心用:Jina AI 向所有用户赠送一百万 token,访问 jina.ai/embeddings 即可免费领取密钥,没有任何套路,即刻享受 8K 长度、双语支持和轻松集成的向量模型体验。
模型概述
在 NLP 任务中,文本通过向量模型转换为数字向量,以便进行检索、分类和语义匹配。在 LLM 时代,向量模型在解决上下文长度限制和知识整合中成为了关键角色,尤其在检索增强生成(RAG)场景下,通过将文档转化为向量,模型能快速找到相关文档以生成回答。
Jina Embeddings V2 模型自去年 10 月发布以来备受关注,获得了各界好评,并集成了数十家流行数据库、向量数据库、RAG 和 LLMOps 框架。
最新推出的全新中英、英德双语文本向量模型,不仅继承了 V2 的全部优势,能够处理长达八千词元的文本,更能流畅应对中英双语、英德双语内容&