Zilliz Planet-CSDN博客

原创 Milvus × RAG助力快看多业务应用

在做了一些技术选型后，快看漫画团队最后选定了 Milvus作为向量检索引擎。

2024-07-26 21:00:00 740

01.快看介绍快看漫画创办于2014年，集漫画阅读、创作互动、线下漫画沉浸体验、周边衍生品购买等体验于一体，是年轻人的一站式漫画生活方式平台。截止到2023年底，快看总用户超过3.8亿，在中国漫画市场渗透率超过50%。经过9年的创作者生态建设，快看已汇聚超过12万注册创作者，发表漫画作品超13000部。目前，快看漫画已有超过500部作品登陆全球近200个国家和地区，成为中国文化出海的代表。除了线上...

2024-07-26 17:30:21 218

原创 Milvus 向量数据库进阶系列丨部署形态选型

Milvus 是目前发展最成熟的开源向量数据库项目。和 Qdrant、Weaviate、Chroma 这些近两年的新项目不同，Milvus 为开发者提供了多种部署形态。

2024-07-25 19:00:00 473

原创聊一聊：你在用哪些AI工具？（内含福利！！）

在评论区留言，向大家分享你最爱的AI工具及使用场景。获赞最多的朋友将获得【Zilliz超萌小鸟袜】！！（截止时间：7月26日 24:00）

2024-07-24 18:25:54 80

原创云启AI，数领未来｜Zilliz 华北地区高层闭门会圆满结束

024年7月18日下午，由向量数据库领军者 Zilliz、亚马逊云科技及橘子联盟联合举办的华北地区 CEO、CTO高层闭门会在东城区戏院胡同时光别院圆满举办。

2024-07-24 17:45:00 503

原创 Zilliz 推出 Spark Connector：简化非结构化数据处理流程

本文将介绍 Spark Connector 及其应用场景，并手把手教你如何使用它实现数据推送。

2024-07-23 17:55:22 655

原创 (内含福利!!) 8月17日，邀您共赴南京Unstructured Data Meetup！

8月 17 日，备受硅谷开发者喜爱的 Unstructured Data Meetup 第四场将在南京举办！

2024-07-23 12:12:20 359

原创活动回顾｜Unstructured Data Meetup 北京场

7月20日，北京Unstructured Data Meetup圆满落下帷幕。这场由向量数据库领军者 Zilliz 举办的盛会，为参与者提供了最前沿的技术交流平台，也为中国的 AI 领域注入了新的活力。Unstructured Data Meetup 旨在借助 GenAI 的力量，推动非结构化数据领域的创新与发展。在这次北京场活动中，我们深入探讨了非结构化数据的行业趋势、技术应用和未来展望。01....

2024-07-22 18:50:17 729

原创如何定位Milvus性能瓶颈并优化

本文将以 Milvus 向量数据库为例，特别关注 Milvus 2.2 或以上版本，讲解如何监控搜索性能、识别瓶颈并优化向量数据库性能。

2024-07-19 16:55:27 973

原创一文看懂开源许可证：大语言模型和向量数据库入门指南

本指南将解析与人工智能技术特别相关的开源许可证，例如向量数据库和大语言模型（LLMs）开源许可证。

2024-07-18 17:45:00 546

原创向量数据库性能测试技巧

如何评估并挑选出最适合您的向量数据库呢？本文将深入探讨向量数据库的关键评估指标和性能测试工具。

2024-07-17 17:44:48 775

原创详解 BGE-M3 与 Splade 模型

本文将探索两种先进的 Embedding 模型——BGE-M3 和 Splade，深入解析它们的设计理念和工作原理。

2024-07-16 19:50:02 924

原创详解如何通过稀疏向量优化信息检索

Learned 稀疏 Embedding 提供了一套独特的解决方案，结合了稀疏表示的可解释性（interpretability）和深度学习模型的语境理解能力。

2024-07-12 18:37:47 1059

原创 7 月 20 日，北京Unstructured Data Meetup来了！

定了！7月 20 日，备受硅谷开发者喜爱的 Unstructured Data Meetup 第三场将在北京举办！

2024-07-12 11:03:22 287

原创 Milvus跨集群数据迁移

将 Milvus 数据从 A 集群（K8S集群）迁到 B 集群（K8S集群），解决方案很多，这里提供一个使用官方 milvus-backup 工具进行数据迁移的方案。注意：此方案为非实时同步方案，但借助 MinIO 客户端的数据同步功能，应该也是可以做到实时同步迁移。步骤概览制作 milvus-backup 镜像，方便备份工具在 K8S 集群中使用 service name 访问 milvus 和...

2024-06-13 17:58:14 1137

原创成本最高直降50倍！Zilliz Cloud Serverless Beta上线，限时免费，早用早省钱

专为查询量不固定或者不频繁的Serverless应用设计，点击注册，Beta期间免费使用！

2024-06-12 14:42:14 168

原创还能报名！风靡硅谷开发者的Unstructured Data Meetup 杭州站与您6月15日见面！

如果您对非结构化数据处理、大模型技术、向量数据库技术或者 AIGC 应用开发有着丰富的实践经验，并且又乐于和技术社区分享交流，欢迎报名成为我们的 Unstructured Data Meetup 的讲师（Zilliz 微信公众号回复关键词“讲师报名”），Zilliz 期待与各位共同开启未来的新篇章。Unstructured Data Meetup 是一个汇聚行业精英和创新者的平台，是探索非结构化数据与 GenAI 技术前沿的绝佳机会，更是一个开放的社区，提供给所有参会者分享和交流的机会。

2024-06-12 12:20:58 238

原创客户案例｜Zilliz Cloud 助力点石科技转型 AI 智能服务商

业务实际上线后，当前“爱晚亭”AI系统已经达到了80%的问答召回率，超过80% 的问答召回率则通常被认为是非常优秀的。Zilliz Cloud的Partition Key方案可以完美的应对这样的特定场景：所有客户的知识库服务后台共享一个 Zilliz Cloud Cluster，Partition Key方案为每个用户提供一个Partition key 来实现寻址，可达到百万级租户的能力，它允许用户根据实际需求灵活地划分和管理数据，从而提高系统的可扩展性、灵活性和性能。生态丰富，适合AIGC应用场景。

2024-06-04 18:31:39 658 1

原创直播预告｜手把手教你玩转 Milvus Lite ！

上周，我们发布了名为《重磅推出：Milvus Lite 正式上线，几秒内即可轻松搭建 GenAI 应用》的文章，讲解了 Milvus Lite 的由来及使用方法。Milvus Lite（https://milvus.io/docs/milvus_lite.md）是一个轻量级向量数据库，支持本地运行，可用于搭建 Python 应用，由 Zilliz 基于全球最受欢迎的开源向量数据库 Milvus（https://milvus.io/intro）研发。

2024-06-03 19:40:05 291 2

原创重磅推出：Milvus Lite 正式上线，几秒内即可轻松搭建 GenAI 应用

Milvus Lite（https://milvus.io/docs/milvus_lite.md）是一个轻量级向量数据库，支持本地运行，可用于搭建 Python 应用，由 Zilliz 基于全球最受欢迎的开源向量数据库 Milvus（https://milvus.io/intro）研发。值得一提的是，Milvus Lite 与 Milvus 共享同一套 API，以确保您的客户端代码既适用于小规模的本地部署，也适用于生产环境中大规模（十亿级数据）的 Docker 或 Kubernetes 部署。

2024-06-01 23:07:22 767

原创重磅推出：Milvus Lite 正式上线，几秒内即可轻松搭建 GenAI 应用

和超薄笔记本一样轻便、强大的 Milvus Lite 正式上线！Milvus Lite（https://milvus.io/docs/milvus_lite.md）是一个轻量级向量数据库，支持本地运行，可用于搭建 Python 应用，由 Zilliz 基于全球最受欢迎的开源向量数据库 Milvus（https://milvus.io/intro）研发。从架构上，Milvus Lite 复用了 Mi...

2024-05-31 20:13:06 975

原创向量数据库引领 AI 创新——Zilliz 亮相 2024 亚马逊云科技中国峰会

而丰富的AI生态，可以极大简化业务开发流程。他提到，非结构化数据赋能生成式AI应用，除了检索增强生成 (RAG)、多模态搜索等应用，目前也应用到自动驾驶数据准备，面向海量样本数据存储、高效检索，精准匹配，优化决策与导航。在亚马逊云科技中国峰会 ISV 行业论坛上，Zilliz 合伙人、研发 VP 栾小凡以“基于Zilliz重构数字战略，打造生成式AI应用”为主题进行分享，他提到根据IDC调查显示，到2027年，86.8% 的数据属于非结构化数据，然而只有18%的企业机构认为他们有效地利用了非结构化数据。

2024-05-30 19:22:33 1014

原创活动预告｜与 Zilliz 共探亚马逊云科技中国峰会

同日，2024 亚马逊云科技合作伙伴峰会开幕，峰会将以“共赴·合作新征程”为主题，邀请到来自全球和全国各地的近千名亚马逊云科技的合作伙伴高管。参与者将有机会了解云计算推动行业发展的新趋势与解决方案、生成式 AI 等前沿技术的落地实践，通过大量成功案例解析，获得灵感及经验来解决实际问题，与业内专家建立新的人脉关系，拓展更多业务增长及转型机会。Zilliz 作为亚马逊云科技的重要合作伙伴，深度参与了此次盛会，在亚马逊云科技中国峰会 ISV 行业论坛、亚马逊云科技合作伙伴峰会等均有精彩分享。

2024-05-27 18:48:34 381

原创一文深度剖析 ColBERT

ColBERT的独特之处在于引入了一种新颖的后期交互机制，可以通过在检索过程的最终阶段之前分别处理查询和文档，实现高效和精确的排名和检索。在之前的文章中，我们已经深入探讨了各种类型的 embedding 向量和专为高效信息检索而设计的模型，包括针对具体用例设计的稠密、稀疏和二进制 embedding 向量，它们各自的优势和劣势。然后，后期交互阶段使用针对每个Eq中的向量，找与其产生最大内积的Ed中的向量（即为向量之间的相似性），并将所有分数求和的最大相似性（MaxSim）计算。输出一组向量，表示为。

2024-05-24 21:00:06 461

原创基于 Milvus + LlamaIndex 实现高级 RAG

随着大语言模型（LLM）技术的发展，RAG（Retrieval Augmented Generation）技术得到了广泛探讨和研究，越来越多的高级 RAG 检索方法也随之被人发现，相对于普通的 RAG 检索，高级 RAG 通过更深化的技术细节、更复杂的搜索策略，提供出了更准确、更相关、更丰富的信息检索结果。如果检索需要精确的关键词匹配，这种检索技术很有益处。生成回复质量面临着幻觉挑战，即 LLM 生成的答案并没有基于所提供的上下文，和上下文不相关，或者生成的回复存在着包含有害或歧视内容的潜在风险。

2024-05-22 19:58:25 1030

原创 Gen AI 连接非结构化数据，Unstructured Data Meetup 第二场官宣杭州！

这不仅是简单的技术交流，更是对数据科学未来的无尽探索。在此背景下，由向量数据库领军者 Zilliz 创办的 Unstructured Data Meetup 风靡美国，掀起了一股关于非结构化数据与 GenAI 的热潮，如今，这个风靡硅谷开发者的活动即将登录中国，为开发者们带来更多全球化的洞察。Unstructured Data Meetup 是一个汇聚行业精英和创新者的平台，是探索非结构化数据与 GenAI 技术前沿的绝佳机会，更是一个开放的社区，提供给所有参会者分享和交流的机会。

2024-05-20 18:14:04 261

原创 GPT-4o 引领人机交互新风向，向量数据库赛道沸腾了

比如在向量的维度上，传统的在向量上引入的降维方案对于查询的准确度影响都比较大，而 OpenAI 发布的 ext-embedding-3-large （https://openai.com/index/new-embedding-models-and-api-updates/）模型可以通过参数控制输出向量的维度，在降低向量维度的同时，对下游任务的效果影响很小。我们使用支持了 GPU 索引的 Milvus 进行测试，在仅仅 2-3 倍的成本下，无论是构建索引还是向量检索，都展现出来了几倍到数十倍的性能差距。

2024-05-15 18:09:53 471 2

原创手把手系列！使用 Zilliz Cloud 和 AWS Bedrock 搭建 RAG 应用

我们将通过以下示例代码（https://colab.research.google.com/github/milvus-io/bootcamp/blob/master/bootcamp/RAG/bedrock_langchain_zilliz_rag.ipynb#scrollTo=fHn0m6Y0ytIP），演示如何使用 Zilliz Cloud 与 AWS Bedrock 搭建 RAG 应用。然后检索到的文档经过格式化组织称成连贯的文本，AI 将相关信息整合到响应中，最终提供高度准确度和相关的答案。

2024-05-10 17:40:49 776 1

原创海外市场成 ISV 新掘金地？生成式 AI 如何加速业务创新实践？Zilliz 有话说

行业全球化新态势洞察，ISV 如何构建全球化战略的顶层设计，SaaS 优良架构如何助力 ISV 企业全球化发展，ISV 全球化安全合规实践以及最佳案例分享。2024 年 5 月 10 日，亚马逊科技携手西安市人工智能产业发展联盟、西安市数据产业协会和合作伙伴共同举办的“生成式 AI 领航，加速业务创新实践”城市巡演。如何高效构建生成式 AI 应用，实现业务创新成为企业关注的重点。5 月 10 日，Zilliz 将闪现亚马逊云科技的两场活动现场（苏州、西安），与大家共话行业发展与未来，欢迎报名围观！

2024-05-08 18:27:21 432

原创 RAG 修炼手册｜揭秘 RAG 时代的新向量数据库

RAG 场景中对向量数据库的召回效果有着严格的要求，不仅需要高精度和快速响应的召回这类基础能力，还需要处理多模态数据的能力以及可解释性和可调试性这类更高级的功能，以确保生成模型能够基于高质量的召回结果产生准确和相关的输出。其次在检索效率方面，由于信息可以表示成高维向量，针对向量加上特殊的索引优化和量化方法，可以极大提升检索效率并压缩存储成本，随着数据量的增长，向量数据库能够水平扩展，保持查询的响应时间，这对于需要处理海量数据的 RAG 系统至关重要，因此向量数据库更擅长处理超大规模的非结构化数据。

2024-05-07 17:16:34 959

原创全面提升 RAG 质量！Zilliz 携手智源集成 Sparse Embedding、Reranke

得益于 Milvus 2.4 最新推出的 Sparse Vector（稀疏向量）和 Multi-vector（多向量）支持，开发者获得了多种选择，不仅有业界广泛采用的 Dense Embedding（稠密向量模型），还能使用 BGE 最新推出的 Sparse Embedding（稀疏检索模型）、Reranker（重排序）模型。而 Embedding 模型和向量数据库是实现这一方案的关键，更好的模型、功能更丰富的向量数据库，能够有效提升 RAG 的回复质量，帮助大语言模型实现更好的终端问答体验。

2024-04-29 17:23:26 458 3

原创客户案例｜Zilliz Cloud 助力 AI 在线教育：智慧树的创新之路

在信息技术飞速发展的今天，教育行业正经历着一场深刻的变革。智慧树，作为全球领先的学分课程运营服务平台，始终站在教育创新的前沿。为了进一步提升教育质量和效率，智慧树携手 Zilliz Cloud，共同开启了一场教育与技术的深度融合之旅。通过 Zilliz Cloud 高效、智能的向量数据库服务，不仅优化了在线学习体验，更为教育的未来描绘了一幅充满可能性的蓝图。01.智慧树：在线教育的领航者智慧树不仅...

2024-04-25 18:10:40 534

原创 Zilliz Cloud 助力 AI 在线教育：智慧树的创新之路

这一技术的应用，不仅提高了题库管理的效率，也为教师节省了大量的时间和精力，使他们能够专注于教学内容的创新和优化。这一技术的应用不仅加速了知识图谱的构建过程，也为智慧树提供了更为丰富和精准的教育内容关联，进一步增强了平台的教育服务能力。通过 Zilliz Cloud，智慧树能够享受到专家团队的支持，快速解决业务中遇到的技术问题，确保了平台的稳定运行和业务的持续增长。我们相信，未来 AI 技术将在教育领域发挥更大的作用，为在线教育带来更多的创新和变革，我们将继续用技术的力量点亮每一个学习的梦想。

2024-04-25 16:28:33 703

原创 Milvus 在哈啰的应用与落地

本期的【User Tech】直播告诉你答案！明晚的直播，我们邀请了来自哈啰的资深研发工程师王永辉，他将为我们详细讲解 Milvus 在本地出行及生活服务平台的应用及未来发展的诸多可能性，敬请期待！如果在使用 Milvus 或 Zilliz 产品有任何问题，可添加小助手微信 “zilliz-tech” 加入交流群。欢迎关注微信公众号“Zilliz”，了解最新资讯。好消息，Milvus 社区正全网寻找「向量数据库还有哪些可能性？

2024-04-24 18:25:12 273

原创 RAG 修炼手册｜如何评估 RAG 应用？

在设计这些 prompt 时，有时还要考虑 LLM 的一些偏见，比如 LLM 常见的位置偏见：当 prompt 比较长时，LLM 容易注意到 prompt 里前面的一些内容，而忽略一些中间位置的内容。因此内部的一些关键组件就可以决定这个 RAG 应用表现的好坏。当以黑盒方式来评估 RAG 应用时，我们看不到 RAG 应用的内部，只能从输入给 RAG 应用的信息和它返回的信息来评估 RAG 的效果。但对于一些比较简单的 query 测试，比如标准答案只有一些简单的短语的，也可以使用一些经典的指标。

2024-04-23 18:42:59 962

原创欢迎「北辰使者」！首发队伍已集结，Milvus 社区力量持续壮大！

一个月前，Milvus 社区发起了北极星计划，旨在汇集和团结 Milvus 社区的热心用户及开发者，组成社区大使团队，根据不同朋友擅长的能力（Coding、写作、沟通、布道、活动组织等），在社区中分配职责，共同建设运营 Milvus 社区，为社区发展壮大探索方向。本着对社区负责的态度，我们进行了紧张的面试与选拔，最终选出了 7 位优秀的「北辰使者」！「北辰使团」队伍持续组建中，感兴趣的朋友们记得发送简历至邮箱：community@zilliz.com，并在邮件主题中注明“Milvus 北极星申请”。

2024-04-19 16:46:54 243

原创客户案例｜权威答案！灵犀医疗引入 Zilliz Cloud，千万级向量数据库赋能医学 AIGC 平台...

“医疗行业是一个信息差较大的行业，术语体系庞杂且知识门类较多，如何能搜索到最精准的医学知识并采用最合理方式进行总结，这是我们医学 AIGC 平台 EviMed 所遇见的最主要的技术问题。传统的数据库和全文检索方式难以满足我们的技术要求，结合了 Zilliz Cloud 向量数据库服务之后，我们的系统效能显著提升，客户响应速度提升了 8%，搜索结果精准度提升约 10%，企业内部运维成本也降低了 30...

2024-04-18 18:00:21 902

原创权威答案！灵犀医疗引入 Zilliz Cloud，千万级向量数据库赋能医学 AIGC 平台

为 AI Agent 提供了“记忆力”：EviMed 的数据分析版块构建了一套 AI Agent，如果将所有的背景信息全部输入进大模型的话成本较高，而向量数据库可以将这些背景信息存储下来，后续根据 Agent 的需求再进行向量匹配的调取，从而一定程度上去除了大模型长上下文的依赖，降低了数据分析的成本。运维成本降低 30%：Zilliz Cloud 提供了全套的向量存储和搜索云服务，并可实现弹性扩缩容，与 EviMed SaaS 平台无缝融合，即插即用，极大的降低了企业的系统运维成本。

2024-04-18 17:06:20 1008 1

原创提高 RAG 应用准确度，时下流行的 Reranker 了解一下？

这是因为重排过程需要对每个候选文档进行高成本的模型推理，不同于前者可以每次查询都复用离线索引的结果，使用 Reranker 需要每次在线查询都进行推理，结果无法复用，带来重复的开销。虽然 Reranker 的使用成本远高于单纯使用向量检索的成本，但它仍然比使用 LLM 为同等数量文档生成答案的成本要低。在 RAG 架构中，Reranker 可以筛选向量搜索的初步结果，丢弃掉与查询相关性低的文档，从而有效防止 LLM 处理无关信息，相比于将向量搜索返回的结果全部送进 LLM 可大大减少生成部分的耗时和成本。

2024-04-17 20:35:29 4809

原创 Milvus 老友汇｜RAG 场景、电商平台、AI 平台……如何用向量数据库构建业务方案？

值得关注的是，Zilliz Cloud 上线了 Pipelines，它可以将文档、文本片段和图像等非结构化数据转换成可搜索的向量并存储在 Collection 中，帮助开发者简化工程开发，助力其实现多种场景的 RAG 应用，将复杂生产系统的搭建和维护简化成 API 调用，为 AI 应用开发者赋能。苏佺道提到，除了数字员工系统，爱晚亭 AI 平台还包含大模型 PK 系统，它集成了 10 多个业界主流的大模型，包括GPT4.0、3.5、谷歌 Gemini、讯飞星火、百度文心一言等。

2024-04-16 18:11:04 408

空空如也

空空如也