Elastic 中国社区官方博客

关于 Elastic Stack 及相关的任何技术

JINA

关注

文章平均质量分 92

关注数：文章数：30 文章阅读量：31724 文章收藏量：428

作者: Elastic 中国社区官方博客

Elastic 首席布道师，Elastic 认证工程师，认证分析师，认证可观测性工程师，阿里云最有价值专家

展开

专栏收录文章

使用 Jina CLIP v2 和 Elasticsearch 实现多语言图片搜索

本文介绍如何利用Jina CLIPv2和Elasticsearch构建多语言图片搜索系统。该系统支持89种语言查询，无需翻译流水线，并通过Matryoshka Representations技术将索引大小减少75%。文章详细对比了Jina CLIPv1和v2的特性改进，包括多语言支持、图像分辨率提升等，并提供了完整的代码实现流程，涵盖图片嵌入生成、Elasticsearch索引构建、多语言文本搜索和图像搜索功能。特别介绍了Matryoshka Representations如何在不显著影响检索质量的前提下优

原创 2026-06-02 07:55:08 · 391 阅读 · 0 评论
小模型，大基准测试：Jina-VLM 如何以 2.4B 参数击败竞争对手，以及 ICLR 告诉我们的下一步趋势

Jina-VLM：开源多语言视觉语言模型在ICLR 2026引关注 Jina-VLM是一个2.4B参数的开源视觉语言模型，在29种语言的VQA基准测试中表现优异。该模型创新性地结合SigLIP2视觉编码器和Qwen3语言解码器，采用注意力池化技术处理任意分辨率输入。ICLR 2026会议展示了AI领域的最新趋势：强化学习验证(RLVR)成为主流、测试时计算受到重视、视觉语言行动模型(VLA)快速发展。会议还探讨了嵌入模型和检索技术的新进展，包括稠密检索训练、稀疏表示优化等。这些突破为信息检索领域带来新机遇，

原创 2026-05-28 08:57:19 · 562 阅读 · 0 评论
jina-embeddings-v5-omni：用于文本、图像、音频和视频的 embeddings

Jina AI发布多模态嵌入模型jina-embeddings-v5-omni，支持文本、图像、音频和视频处理。该模型采用冻结文本骨干网络架构，仅训练0.35%的权重，在保持与v5-text文本嵌入完全一致的同时，新增视觉和音频处理能力。其中1.57B参数的small版本在文本、图像和音频任务上表现优异，接近更大参数量的基线模型；0.95B参数的nano版本则在小规模下保持竞争力。该模型支持模块化部署，现有文本索引无需重建即可直接使用，实现了多模态检索的即插即用升级。

原创 2026-05-13 15:21:48 · 836 阅读 · 0 评论
一个索引，所有媒体：介绍 jina-embeddings-v5-omni

Jina-embeddings-v5-omni是一款创新的多模态嵌入模型，支持文本、图像、视频和音频的统一索引与跨模态检索。该模型基于jina-embeddings-v5-text架构扩展，通过创新的跨模态投影技术整合视觉和音频编码能力，在保持紧凑模型规模（small版7亿参数）的同时，提供行业领先的多媒体语义理解性能。其特点包括：支持近100种语言、可截断嵌入降低存储需求、量化优化提升效率，在视觉文档检索、视频片段定位等任务中表现优异。目前提供small和nano两个版本，支持Elasticsearch集

原创 2026-05-12 09:42:00 · 1311 阅读 · 0 评论
Jina embeddings v3 现已在 Gemini Enterprise Agent Platform Model Garden 上可用

摘要：Elastic与Jina AI合作推出jina-embeddings-v3文本嵌入模型，现可在Google Cloud的Gemini Enterprise Agent Platform Model Garden上自行部署。该模型运行在用户自有VPC内的L4 GPU实例上，确保数据安全、成本可控。模型支持8K上下文、1024维输出，并具备多语言能力。未来还将陆续推出v5系列文本嵌入、重排序模型jina-reranker-v3和多模态模型jina-clip-v2，形成完整检索栈。这种部署模式避免了API调

原创 2026-04-23 09:47:53 · 491 阅读 · 0 评论
使用 Jina 远程 MCP 服务器的 Agentic 工作流

JinaAI推出Model Context Protocol (MCP)简化AI代理开发，通过标准化API连接工具与LLM。文章展示了三个应用案例：arXiv论文摘要生成、游戏公司市场研究、AI法律合规报告。相比传统方法，MCP减少了自定义代码需求，提高了工作流可靠性。测试发现Claude Sonnet 4表现最佳，而多数开源模型存在推理循环问题。尽管当前代理技术尚未完全成熟，但MCP生态的快速发展正推动实验性代理向生产级应用迈进。该技术使API组合更灵活，为构建可靠AI系统提供了新途径。

原创 2026-04-15 15:34:32 · 614 阅读 · 0 评论
使用 Elasticsearch + Jina embeddings 进行无监督文档聚类

本文介绍了一种基于Elasticsearch和Jina embeddings的无监督文档聚类方法，适用于新闻、法律文件等文本数据的主题发现。该方法采用密度探测的质心分类算法，利用Elasticsearch的kNN搜索实现高效聚类，并通过significant_text自动生成聚类标签。特别设计了时间序列故事链功能，能追踪主题随时间的演变。实验使用8500篇新闻数据，结果显示该方法能有效识别紧密主题簇（71.1%文档被聚类），同时保持合理的噪声率（28.9%）。技术亮点包括：Jina v5专用聚类embedd

原创 2026-04-11 11:24:43 · 865 阅读 · 0 评论
jina-embeddings-v5-text：新的最先进水平小型多语言 embeddings

ElasticJINA发布第五代多语言嵌入模型jina-embeddings-v5，包含677M参数的small版和239M参数的nano版，在性能与效率边界取得突破。small版支持32K token上下文，nano版支持8K，均配备4个任务专用LoRA适配器。在MTEB等基准测试中，v5-small以sub-1B参数量达到与3.8B模型相当的检索性能，体积缩小5.6倍；v5-nano则以极小参数规模跻身top-11。模型支持多种部署方式，包括ElasticInferenceService、Hugging

原创 2026-04-10 12:54:15 · 867 阅读 · 0 评论
使用 Jina-VLM 小型多语言视觉语言模型来和图片对话

本文介绍了如何使用Python应用演示Jina-VLM多语言视觉语言模型。首先需要克隆代码库并配置API密钥，应用通过Streamlit构建交互界面，支持从侧边栏选择图片并进行对话。核心功能包括：1)图片选择与管理；2)聊天记录维护；3)通过API与Jina-VLM交互获取图片问答结果。运行方式为streamlit run app.py，界面分为图片选择区和聊天区，用户可针对所选图片提问并获得AI生成的回答。该演示展示了Jina-VLM在视觉问答任务中的实际应用能力。

原创 2026-04-09 21:18:09 · 352 阅读 · 0 评论
Elasticsearch：运用 JINA 来实现多模态搜索的 RAG

本文介绍如何使用JinaEmbeddingsv4模型构建多模态检索增强生成(RAG)系统。系统支持图片和文本的向量化检索，通过Elasticsearch存储向量数据，并集成Gemini-3-Flash多模态LLM生成回答。实现步骤包括：1)下载源码并配置环境变量；2)使用Streamlit构建交互界面；3)通过Jina模型将图片/文本转换为向量；4)实现KNN检索功能；5)整合Gemini-3-Flash进行RAG生成。系统可对"StarWars"等查询返回相关图片和文本，并生成多模态响

原创 2026-04-08 15:42:14 · 586 阅读 · 0 评论
Elasticsearch：语义搜索，现在默认支持多语言

Elasticsearch宣布semantic_text字段类型现默认使用Elastic Inference Service上的jina-embeddings-v5-text模型，实现开箱即用的多语言语义搜索。该方案无需额外配置即可自动处理文本分块、向量生成和跨语言查询，支持包括检索、分类等任务。用户只需定义semantic_text字段，即可对多语言文档进行语义检索，查询结果按语义相关性而非语言匹配排序。该服务提供GPU加速推理，免除模型托管和基础设施管理负担，适用于全球数据集搜索和AI应用开发。

原创 2026-04-08 08:22:49 · 983 阅读 · 0 评论
使用 Jina Embeddings v5 和 Elasticsearch 构建“与你的网站数据聊天”的 agent

本文介绍如何利用Elasticsearch Serverless、Jina Embeddings v5、Elastic Open Web Crawler和Elastic Agent Builder，在一小时内构建"与网站聊天"的功能。通过创建Serverless项目、建立语义索引、使用Crawly抓取网站数据，最后在Kibana中配置Agent实现基于网站内容的智能问答。整个过程无需自定义分块或嵌入管道，最终可获得能引用网页内容回答问题的智能代理。该方案可快速应用于各类网站或文档数据源。

原创 2026-02-25 09:48:02 · 1432 阅读 · 0 评论
jina-embeddings-v5-text：用于搜索和智能应用的紧凑型最先进文本嵌入

摘要：Elastic与Jina AI合作发布jina-embeddings-v5-text系列多语言嵌入模型，包含small(677M参数)和nano(239M参数)两个版本，支持长文本输入和高效向量生成。该系列通过任务优化的LoRA适配器、嵌入截断和稳健量化技术，在保持高性能的同时显著降低计算成本。模型在MMTEB多语言基准测试中表现优异，并已集成至Elastic Inference Service，支持语义搜索等AI应用场景。用户可通过Elasticsearch直接调用，或在HuggingFace获取本

原创 2026-02-24 09:48:22 · 1246 阅读 · 0 评论
jina-vlm：像 AI 一样看世界，使用视觉语言模型

本文介绍了视觉语言模型(VLM)jina-vlm的功能与应用。该模型结合文本和图像输入，能执行视觉问答、图像描述生成、内容分析等任务，特别擅长处理图表、扫描件等非自然场景图像。文章详细展示了jina-vlm在无障碍服务、内容索引、跨语言处理等方面的应用案例，同时指出其作为小型模型存在的幻觉问题，并提供了优化提示词、指定语言等最佳实践建议。用户可通过API或本地部署使用该模型，Elastic提供免费试用token。

原创 2026-02-10 11:43:29 · 1177 阅读 · 0 评论
Jina Rerankers 为 Elastic 推理服务（EIS）带来了快速、多语言的重排序能力

Elastic在EIS上推出jina-reranker-v2和v3多语言重排序模型，支持直接在Elasticsearch中实现高精度检索和RAG工作流。v2作为紧凑型模型支持函数调用和大规模推理，v3则通过listwise重排序提供更优性能。这些模型可与jina-embeddings-v3结合使用，开发者无需管理基础设施即可构建多语言搜索管道。Elastic Cloud试用用户现可体验这些功能。

原创 2026-02-04 12:06:01 · 1296 阅读 · 0 评论
Jina Embeddings v4: 多模态多语言检索的通用向量

JinaEmbeddings v4是Jina AI最新发布的38亿参数多模态向量模型，支持文本和图像嵌入。该模型基于Qwen2.5-VL-3B-Instruct主干，采用任务专用LoRA适配器优化检索性能，支持单向量(2048维)和多向量(每个token 128维)输出。在MTEB、MMTEB等基准测试中，v4在多语言检索上比OpenAI text-embedding-3-large高12%，长文档任务提升28%，代码检索比voyage-3高15%。特别擅长处理视觉丰富内容，在ViDoRe基准达90.2分。

原创 2026-01-15 12:54:42 · 1429 阅读 · 0 评论
JINA AI 与 Elasticsearch 的集成

JinaAI与Elasticsearch深度整合，推出多款高性能AI模型：jina-embeddings-v4支持30种语言的文本/图像处理，具备单/多向量两种嵌入模式；v3专注于多语言文本嵌入；code-embeddings针对15种编程语言优化；clip-v2实现文本-图像跨模态检索；reranker系列提升搜索结果精度。这些模型支持从64到1536维的可调嵌入尺寸，在保持精度的同时优化存储和检索效率，适用于语义搜索、代码匹配、文档分类等多种场景。用户可通过API免费测试1000万tokens，或下载模

原创 2026-01-14 07:25:42 · 868 阅读 · 0 评论
Elasticsearch：Jina Reader

Jina Reader提供两种核心服务：r.jina.ai可将网页/PDF转换为干净文本（Markdown/JSON），s.jina.ai实现结构化网页搜索。通过模拟浏览器渲染确保内容提取准确性，支持curl/wget/Python调用，认证用户享有更高优先级。该服务特别适合为RAG系统和AI代理提供预处理数据，与Elasticsearch等系统无缝集成，解决了从复杂网络内容中提取有效信息的难题。

原创 2026-01-13 12:44:32 · 1490 阅读 · 0 评论
Elasticsearch：Jina Reranker v3

本文介绍了如何在Elasticsearch中使用JinaReranker v3优化搜索结果。首先注册JinaAI推理API端点，创建包含多语言文本和嵌入向量的索引，并设置自动生成嵌入的管道。通过对比BM25关键词搜索和向量搜索的差异，展示了混合检索方法（RRF）的优势。最后详细说明了如何将JinaReranker作为重排序层加入搜索流程，通过语义相关性分析优化结果排序，显著提升多语言搜索质量。整个过程均在Elasticsearch控制台中完成，无需外部工具。

原创 2026-01-13 08:15:14 · 1223 阅读 · 0 评论
使用 jina-embeddings-v3 和 Elasticsearch 进行多语言搜索

本教程介绍如何使用Jina AI的jina-embeddings-v3模型构建多语言语义搜索系统。主要内容包括：1)获取Jina API密钥；2)在Elastic Cloud注册模型并验证；3)创建支持1024维向量的索引；4)设置自动处理内容的ingest pipeline；5)添加英语、法语和西班牙语文档；6)使用德语查询演示跨语言搜索功能，通过kNN算法返回最匹配结果。该方案支持多种语言的高效语义检索。

原创 2026-01-13 07:50:55 · 785 阅读 · 0 评论
jina-embeddings-v3 现已在 Elastic Inference Service 上可用

摘要：Elastic推出jina-embeddings-v3多语言嵌入模型，通过Elastic推理服务(EIS)提供高效语义检索。该模型支持32种语言、8192token上下文，具备参数效率高、维度可调等特点，特别适合RAG系统和多语言搜索。EIS提供完全托管的GPU推理服务，无需额外运维。未来将推出更多JinaAI模型，包括重排序器v2/v3，进一步优化检索精度。所有ElasticCloud试用用户均可访问该服务。

原创 2026-01-13 06:25:34 · 915 阅读 · 0 评论
Jina Code Embeddings：0.5B 和 1.5B 的 SOTA 代码检索

ElasticJINA发布了jina-code-embeddings代码嵌入模型套件，包含0.5B和1.5B两种参数规模的版本，支持1-4bit量化。该模型基于代码生成LLM构建，在25个基准测试中平均性能达78.41%-79.04%，超越同类模型。支持15种编程语言和5种检索任务，采用last-token pooling策略，并引入Matryoshka嵌入技术实现维度灵活截断。模型通过指令前缀实现多任务适配，训练效率高，验证了小模型通过正确架构也能实现先进性能的理念。

原创 2026-01-05 15:03:18 · 777 阅读 · 0 评论
Jina Reranker v3：用于 SOTA 多语言检索的 0.6B 列表式重排序器

Jina AI发布全新jina-reranker-v3重排模型，采用创新的"最后但不迟"交互方式。这款0.6B参数的listwise重排器在多语言检索基准测试中表现优异，在BEIR上达到61.94 nDCG@10，性能超越4B参数的Qwen3-Reranker，同时模型体积缩小6倍。该模型基于Qwen3-0.6B架构，通过单次前向传递实现查询与候选文档的跨文档交互，特别设计的提示模板和特殊标记token确保了高效的语义提取。实验显示模型对输入顺序变化具有鲁棒性，能稳定保持最相关文档的排名

原创 2026-01-05 14:12:12 · 1484 阅读 · 0 评论
Elasticsearch：在 X-mas 吃一些更健康的东西

本文介绍了如何使用Elastic Cloud Serverless构建一个低成本的多语言语义搜索系统，帮助用户在假期购物时快速找到所需水果。通过semantic_text字段类型和内置的Jina多语言密集向量模型，系统可以自动识别不同语言（如英语、法语、德语、西班牙语）的商品名称。文章演示了如何创建商品索引并实现跨语言搜索（如用波兰语"owoce"搜索水果），展示了Elasticsearch在语义搜索方面的改进，包括无需安装模型、自动处理多语言等优势。最后指出这种方案比传统方法更简单高效

原创 2025-12-26 07:41:13 · 582 阅读 · 0 评论
Elasticsearch：探索 CLIP 替代方案

CLIP（- 对比语言 - 图像预训练）是由 OpenAI 创建的神经网络，使用图像和文本对进行训练，以解决在文本和图像之间寻找相似性的任务，并对 “零样本” 图像进行分类，因此模型不是使用固定标签进行训练的，而是我们为模型提供未知类别，以便它可以对我们提供的图像进行分类。实现图像搜索如何实现图像相似性搜索然而，随着时间的推移，出现了更多的替代方案。在本文中，我们将使用房地产示例介绍 CLIP 的两种替代方案的优缺点。

原创 2025-02-19 11:05:25 · 1553 阅读 · 0 评论
Elasticsearch Open Inference API 增加了对 Jina AI 嵌入和 Rerank 模型的支持

探索如何使用 Elasticsearch Open Inference API 访问 Jina AI 模型。我们在 Jina AI 的朋友们将 Jina AI 的嵌入模型和重新排名产品的原生集成添加到 Elasticsearch 开放推理 API 中。这包括对行业领先的多语言文本嵌入和多语言重新排名的支持 —— 针对检索、聚类和分类进行了优化。此次集成为开发者提供了一套基于 Elasticsearch 向量数据库和 Jina AI 的高性能、高性价比的AI信息检索和语义应用工具包。

原创 2025-02-21 06:23:55 · 1704 阅读 · 0 评论
使用 Jina Embeddings v2 在 Elasticsearch 中进行后期分块

在 Elasticsearch 中使用 Jina Embeddings v2 模型并探索长上下文嵌入模型的优缺点。在本文中，我们将配置和使用，这是第一个开源 8K 上下文长度嵌入模型，首先使用进行 OOTB 实现，然后实现 Late Chunking。

原创 2024-11-25 19:05:50 · 1526 阅读 · 0 评论
Jina 模型的介绍，它们的功能，以及在 Elasticsearch 中的使用

Elastic与Jina合作推出的多模态AI模型为Elasticsearch提供了强大的语义搜索能力。该系列模型包含三大类：1）语义嵌入模型（如jina-embeddings-v4），支持文本/图像的多模态嵌入；2）重排序模型（如jina-reranker-v3），提升搜索结果精度；3）小型生成语言模型（如jina-vlm），用于特定任务处理。这些模型采用创新技术如Matryoshka表示学习和LoRA适配器，在保持高性能的同时降低资源消耗。通过Elastic Inference Service，用户可原生

原创 2026-01-02 08:46:49 · 1857 阅读 · 0 评论
Elastic 与 Jina AI 联手推动 AI 应用的开源检索发展

摘要：Elastic宣布与JinaAI合作，将后者的多模态embedding、reranker和小型语言模型技术整合进Elastic搜索平台。JinaAI的前CEO表示，此次合作能将其搜索基础模型与Elastic的规模优势结合，为用户提供更优质的AI搜索体验。这些模型将继续在HuggingFace免费提供，并通过Elastic Cloud的推理服务实现原生集成。文章强调，任何功能发布均由Elastic自主决定，并对第三方AI工具的使用风险作出免责声明。（149字）

原创 2025-10-10 15:10:11 · 1067 阅读 · 0 评论
Jina-VLM：小型多语言视觉语言模型

Jina-VLM是一款2.4B参数的视觉语言模型，在多语言视觉问答(VQA)任务中达到SOTA水平。该模型创新性地采用attention-pooling连接器，将视觉tokens减少4倍，同时保持性能，使其可在消费级硬件运行。通过两阶段训练流程，模型在29种语言中表现出色，并避免了纯文本能力的灾难性遗忘。目前支持通过API、CLI和Transformers库使用，但存在tiling开销和多图像推理的局限性。

原创 2025-12-09 20:39:39 · 1547 阅读 · 0 评论