ZILLIZ

The Most Widely-Adopted Vector Database.

  • 博客(612)
  • 收藏
  • 关注

原创 RAG 修炼手册|如何评估 RAG 应用?

在设计这些 prompt 时,有时还要考虑 LLM 的一些偏见,比如 LLM 常见的位置偏见:当 prompt 比较长时,LLM 容易注意到 prompt 里前面的一些内容,而忽略一些中间位置的内容。因此内部的一些关键组件就可以决定这个 RAG 应用表现的好坏。当以黑盒方式来评估 RAG 应用时,我们看不到 RAG 应用的内部,只能从输入给 RAG 应用的信息和它返回的信息来评估 RAG 的效果。但对于一些比较简单的 query 测试,比如标准答案只有一些简单的短语的,也可以使用一些经典的指标。

2024-04-23 18:42:59 397

原创 欢迎「北辰使者」!首发队伍已集结,Milvus 社区力量持续壮大!

一个月前,Milvus 社区发起了北极星计划,旨在汇集和团结 Milvus 社区的热心用户及开发者,组成社区大使团队,根据不同朋友擅长的能力(Coding、写作、沟通、布道、活动组织等),在社区中分配职责,共同建设运营 Milvus 社区,为社区发展壮大探索方向。本着对社区负责的态度,我们进行了紧张的面试与选拔,最终选出了 7 位优秀的「北辰使者」!「北辰使团」队伍持续组建中,感兴趣的朋友们记得发送简历至邮箱:[email protected],并在邮件主题中注明“Milvus 北极星申请”。

2024-04-19 16:46:54 219

原创 客户案例|权威答案!灵犀医疗引入 Zilliz Cloud,千万级向量数据库赋能医学 AIGC 平台...

“医疗行业是一个信息差较大的行业,术语体系庞杂且知识门类较多,如何能搜索到最精准的医学知识并采用最合理方式进行总结,这是我们医学 AIGC 平台 EviMed 所遇见的最主要的技术问题。传统的数据库和全文检索方式难以满足我们的技术要求,结合了 Zilliz Cloud 向量数据库服务之后,我们的系统效能显著提升,客户响应速度提升了 8%,搜索结果精准度提升约 10%,企业内部运维成本也降低了 30...

2024-04-18 18:00:21 816

原创 权威答案!灵犀医疗引入 Zilliz Cloud,千万级向量数据库赋能医学 AIGC 平台

为 AI Agent 提供了“记忆力”:EviMed 的数据分析版块构建了一套 AI Agent,如果将所有的背景信息全部输入进大模型的话成本较高,而向量数据库可以将这些背景信息存储下来,后续根据 Agent 的需求再进行向量匹配的调取,从而一定程度上去除了大模型长上下文的依赖,降低了数据分析的成本。运维成本降低 30%:Zilliz Cloud 提供了全套的向量存储和搜索云服务,并可实现弹性扩缩容,与 EviMed SaaS 平台无缝融合,即插即用,极大的降低了企业的系统运维成本。

2024-04-18 17:06:20 923

原创 提高 RAG 应用准确度,时下流行的 Reranker 了解一下?

这是因为重排过程需要对每个候选文档进行高成本的模型推理,不同于前者可以每次查询都复用离线索引的结果,使用 Reranker 需要每次在线查询都进行推理,结果无法复用,带来重复的开销。虽然 Reranker 的使用成本远高于单纯使用向量检索的成本,但它仍然比使用 LLM 为同等数量文档生成答案的成本要低。在 RAG 架构中,Reranker 可以筛选向量搜索的初步结果,丢弃掉与查询相关性低的文档,从而有效防止 LLM 处理无关信息,相比于将向量搜索返回的结果全部送进 LLM 可大大减少生成部分的耗时和成本。

2024-04-17 20:35:29 4190

原创 Milvus 老友汇|RAG 场景、电商平台、AI 平台……如何用向量数据库构建业务方案?

值得关注的是,Zilliz Cloud 上线了 Pipelines,它可以将文档、文本片段和图像等非结构化数据转换成可搜索的向量并存储在 Collection 中,帮助开发者简化工程开发,助力其实现多种场景的 RAG 应用,将复杂生产系统的搭建和维护简化成 API 调用,为 AI 应用开发者赋能。苏佺道提到,除了数字员工系统,爱晚亭 AI 平台还包含大模型 PK 系统,它集成了 10 多个业界主流的大模型,包括GPT4.0、3.5、谷歌 Gemini、讯飞星火、百度文心一言等。

2024-04-16 18:11:04 355 1

原创 Last Call!AWS、Shopee、点石科技专家齐聚 Milvus 老友汇 · 线下 Meet

人间四月芳菲尽~在生机勃勃的春天,Milvus 将携手老朋友 Shopee 共同举办深圳站 Meetup!同时,我们也邀请到来自 AWS、点石科技的朋友们,他们将分享电商行业及 RAG 场景如何基于向量数据库构建业务方案。如果在使用 Milvus 或 Zilliz 产品有任何问题,可添加小助手微信 “zilliz-tech” 加入交流群。地点:深圳市南山区光启未来中心 B栋 3F Shopee 培训教室(距离高新园地铁站 500 米)还没报名的朋友,赶紧上车啦~4 月 13 日!

2024-04-11 17:45:34 206

原创 为什么向量数据库在 RAG 中至关重要?

RAG 已经被业界证明可以有效解决大模型的幻觉问题,不过,很多朋友对于向量数据库在其中扮演的角色及背后的原理不甚了解。为此,我们特意邀请到 Zilliz 解决方案架构师刘汉卿,他将从原理到实践,为大家剖析向量数据库在 RAG 中的核心作用!如果在使用 Milvus 或 Zilliz 产品有任何问题,可添加小助手微信 “zilliz-tech” 加入交流群。一个专业的向量数据库究竟是如何运转的?它又是如何为产业赋能的?开箱即用的云原生向量数据库该怎么用?第 1 期的主题便是热度居高不下的 RAG。

2024-04-11 17:17:54 299

原创 RAG 修炼手册|一文讲透 RAG 背后的技术

GPT-2 是于 2019 年发布的改进版本,在GPT-1 的基础上进行了多项改进,包括使用更大规模的训练数据、更深层的模型结构,以及更多的训练迭代次数。这样,相似的单词或句子就会在嵌入空间中被映射为相近的向量,具有相似语义的词语或句子在向量空间上的距离也会较近。随着技术的不断进步和数据的丰富,我们可以期待更加强大的模型的出现。从 GPT-1 到 GPT-3,OpenAI 的语言生成模型在数据规模、模型结构和训练技术上都有了重大的改进和提升,从而实现了更高质量、更具逻辑性和一致性的文本生成能力。

2024-04-10 17:28:42 342

原创 高维解码|Redis 收紧许可证!开源软件公司如何在云时代生存?

这一举动引来了许多开源倡导者的批评,他们认为任何限制公共云提供商的许可证,都违背了由 OSI 定义的开源精神。另一方面,云服务提供商可以轻松地二次开发和转售开源产品,受益于开源公司在代码和开发者社区方面的大量投资,利用云的成本优势和分销渠道快速变现。是时候让开源社区重新思考"开源"的定义了。如果"源代码可用"的许可证仍然能够实现这一点,并提供可持续的商业模式,那么我们需要更新对开源的理解。这样开源公司可以将更多的"绝密武器"释放到开源社区,大大减轻开源开发者的维护负担,增强开源用户的体验。

2024-04-08 17:28:17 547

原创 春天集结!Milvus 老友汇 · 线下 Meetup 来啦!

人间四月芳菲尽~在生机勃勃的春天,Milvus 将携手老朋友 Shopee 共同举办深圳站 Meetup!同时,我们也邀请到来自 AWS、点石科技的朋友们,他们将分享电商行业及 RAG 场景如何基于向量数据库构建业务方案。如果在使用 Milvus 或 Zilliz 产品有任何问题,可添加小助手微信 “zilliz-tech” 加入交流群。地点:深圳市南山区光启未来中心 B栋 3F Shopee 培训教室(距离高新园地铁站 500 米)期待新老朋友在此相聚以及可以酣畅淋漓地交流~4 月 13 日!

2024-04-01 18:10:52 196 2

原创 RAG 修炼手册|RAG 敲响丧钟?大模型长上下文是否意味着向量检索不再重要

这种情况下,由于上下文被切分,系统无法正确理解代词“去了哪里”的指代对象,从而导致了错误的结果。这一趋势的一个副产品是嵌入的上下文窗口也逐渐提升,例如 SRF-Embedding-Mistral 和 GritLM7B 已经支持 32k 的长上下文,这意味着嵌入本身处理长上下文的能力也得到了大幅提升。4.Variety(多样性):实际的落地场景中,不仅仅包含了长文本,图片等非结构化数据,更包含了复杂的结构化数据,比如时间序列数据、图数据、代码的变更历史等等,处理这些数据依然需要足够高效的数据结构和检索算法。

2024-03-28 18:23:52 813

原创 喜获千万元价值补贴,探索 AI 领域新应用:Zilliz 全力支持 AI 初创企业

作为向量数据库赛道的领先者,Zilliz 坚信 AI 叠加向量数据库充满了无限的想象,因此,从未停止过搭建 AI 生态的步伐。最近上线的 Milvus 2.4 支持稠密和稀疏向量的混合查询以提升 RAG 的效果,Zilliz 的商业化产品 Zilliz Cloud 也在早前上线 pipelines,简化将非结构化数据转换为 Embedding 向量的流程,并对接 Zilliz Cloud 向量数据库存储向量数据,实现高效的向量索引和检索。「Zilliz AI 初创计划」正式开启!

2024-03-26 15:10:52 441

原创 引领向量数据库技术新变革,Milvus 2.4 正式上线!

Milvus 2.4 的新增支持 Grouping 搜索功能,使得用户可以在搜索 vector 的基础上做分组聚合,返回的 TopK 是基于分组后的聚合结果而非简单的以向量为中心的片段信息。然而,这些方法是内存密集型的。具体而言,对稀疏向量的支持,进一步增强了 Milvus 的混合搜索能力——即将关键词搜索和向量搜索相结合,最终提高搜索准确性。本次发布中,Milvus 新增支持基于 NVIDIA 的 GPU 索引—— CUDA 加速图形索引(CAGRA),突破了现有向量搜索的能力。

2024-03-25 19:43:42 1701 1

原创 正式支持腾讯云!Zilliz Cloud 多云版图再度扩张

因此,Zilliz Cloud 也一直在不断增加对更多云和节点的支持,满足用户进行全球化业务布局的需求。截止目前,Zilliz Cloud 已实现全球 5 大云 13 个节点的全覆盖,除了在中国的杭州、北京、深圳等五大服务区,其他 8 个节点分布在海外,包括美国的弗吉尼亚州、俄勒冈州、德国的法兰克福、新加坡等城市和地区。3 月 22 日,Zilliz 对外透露,Zilliz Cloud 的用户可以使用腾讯云在北京和上海区的云服务搭建云应用,这将进一步为海内外用户提供更为丰富的多云支持的向量数据库云服务!

2024-03-22 14:50:39 292

原创 Milvus 社区在线寻找「北辰使者」!!!

而 Milvus 北极星计划旨在汇集和团结 Milvus 社区的热心用户及开发者,组成社区大使团队,根据不同朋友擅长的能力(Coding、写作、沟通、布道、活动组织等),在社区中分配职责,共同建设运营 Milvus 社区,为社区发展壮大探索方向。我们面向所有 Milvus 社区的开发者、用户进行招募,如果你使用过 Milvus,喜欢Milvus 社区,希望通过 Milvus 社区学习向量检索领域前沿技术,与社区共同成长进步;Milvus 社区的朋友们,大家好,欢迎来到 Milvus 北极星计划发布现场!

2024-03-20 17:28:46 315

原创 与 NVIDIA 再次合作、深度参与 GTC,Zilliz 与全球顶尖开发者共迎 AI 变革时刻!

Zilliz 与全球的顶尖开发者齐聚 GTC 2024。近日,备受关注的 NVIDIA GTC 2024 已拉开序幕,来自世界各地的顶尖 AI 开发者齐聚美国加州圣何塞会议中心,共同探索行业未来。作为去年被 NVIDIA CEO 黄仁勋提及的向量数据库厂商,Zilliz 今年主要以主题演讲的形式参与其中。Zilliz 创始人兼 CEO 星爵、Zilliz 合伙人及研发 VP 栾小凡、Zilliz AI 和机器学习负责人 Frank Liu 均将在 GTC 不同的环节进行分享。不止如此,Zilliz 还

2024-03-19 18:10:51 459

原创 用户案例|向量引擎在携程酒店搜索中的应用场景和探索

然而,这种方法存在一定的局限性。针对于 Milvus 数据库的部署模块,集群部署方式需要部署以下 8 个组件,分别是访问代理层(proxy)、协调节点(Root coordinator,Query coordinator ,Data coordinator,Index coordinator)和执行节点(Query node,Data node,Index node)。常规的解决方案是添加同义词"好莱坞"和"荷里活"之间的关联,例如将"荷里活"作为"好莱坞"的别名,并在商区实体维护中进行相应的标注。

2024-03-14 18:10:43 990

原创 如何用 RAG 技术玩转文档问答?Milvus × 网易有道 QAnything 为你揭秘!

用户的任何内容,以任意的形式存在,比如各种格式的文档、音频、数据库等,都可以在 QAnything 的支持下,变成可以针对其内容进行问答的使用方式。Zilliz AI 初创计划是面向 AI 初创企业推出的一项扶持计划,预计提供总计 1000 万元的 Zilliz Cloud 抵扣金,致力于帮助 AI 开发者构建高效的非结构化数据管理系统,助力打造高质量 AI 服务与运用,加速产业落地。RAG 和向量数据库的结合,能够有效解决幻觉、时效性差、专业领域知识不足等阻碍大模型应用的核心问题。

2024-03-12 16:50:53 213

原创 客户案例|100M 768 维向量数据,Zilliz Cloud 稳定支持 Shulex VOC 业

而 Zilliz Cloud 使得大模型能够快速有效地检索和处理大量的向量数据,实时召回知识,稳定支撑 Shulex VOC 智能客服业务每秒 90 次的客户询问,稳定召回率在 98% 以上,据统计,Shulex 智能客服机器人已经可以承担 80% 以上的客服工作。数据分析成本降低 50%:由于无需将所有的商品评论信息通过大模型进行分析来获取评论标签,仅需要基于评论原文与向量数据库,实时召回评论标签即可生成高质量标签,去除了对大模型的依赖,极大的降低了评论数据分析的成本。

2024-03-11 18:27:04 657

原创 客户案例|100M 768 维向量数据,Zilliz Cloud 稳定支持 Shulex VOC 业务场景

日前,国际化 VOC SaaS 公司数里行间(Shulex)将上亿数据量的核心业务从开源向量数据库 Milvus 迁移至全托管的向量数据库云服务 Zilliz Cloud。相比于 Milvus,Zilliz Cloud 实现了 Shulex VOC 评论分析洞察报告生成速度 30% 的提升,VOC 智能客服召回率 98%,且系统稳定,0 宕机,大大降低了企业在向量数据库的运维成本。01.从内卷到出...

2024-03-11 18:05:25 306

原创 节日专访|「我」是「我」

前两天在医院碰到一个阿姨在超声科门诊前报到,但却一直没成功(医院的流程也确实复杂),她四下看人求助,但其他人都行色匆匆,无暇理会。当然最重要的是也认识了很多新朋友。新的一年,工作的思考和进步自不必多说,生活的主旋律是行万里路,多看看祖国的大好河山和多元的异域文化,尝试更多有趣和新鲜的事物,拓宽自我生活的边界和跟多元世界的链接。(暴富算吗,哈哈,开个玩笑啦)今年最想做的事情是,去全国各地多多办活动,和更多的用户开发者见面,和许多“网友”去面基,认识不同的人,让更多的人了解 Zilliz、了解 Milvus。

2024-03-08 16:12:37 834

原创 Z Potentials | 星爵,他的征途不止向量数据库

纵观过去几十年的科技发展史,每一代新的技术架构的出现往往都伴随着新的数据范式的出现,也催生了多家百亿到千亿美金数据平台的诞生。如果说 2023 年科技领域的关键词是 LLM,那么数据库领域的关键词一定非向量数据库莫属。向量数据库是一种专门用于存储和检索向量数据的数据库系统。它的设计目标是有效地处理高维向量,通常用于表示复杂的数据结构,如图像、文本、语音等。向量数据库广泛应用于 AI 领域,为各种应用场景提供了更高效、更灵活的数据管理和查询解决方案。在这个领域之中,我们罕见地看到了有一家由华人创办的公司扮演

2024-03-07 18:22:05 988

原创 OpenAI 正面回击马斯克, Claude 3 打破 GPT-4 神话……我在炸裂的消息中发现了华点...

最近,整个硅谷都在关注 OpenAI 和 Anthropic 的动态。先是 Anthropic 发布了 Claude 3,剑指 GPT-4,被媒体认为“打破了 OpenAI 不可战胜的神话”。这也点燃了整个科技圈的热情,纷纷期待 OpenAI 放出 GPT-5 应战。随后(美东时间 3 月 5 日),OpenAI 发布一则官方公告,主题却是在回应和 Elon Musk 的官司问题。随着细节披露得越...

2024-03-06 18:01:57 450

原创 OpenAI 正面回击马斯克,Claude 3 打破 GPT-4 神话……我在炸裂的消息中发现了华点

不过,勤劳的开发者们在吃瓜之际,也没忘讨论两家的技术细节,其中有一个关于“数据安全”的话题引起了我们的注意。Zilliz 在打磨细节之际,也收到了来自管控较为严格的行业公司和组织的需求,他们大多来自于汽车、金融、医疗等行业,需要将数据存储在自己的网络中,从而保证数据合规。Zilliz 深知数据安全的重要性,决心打造 Zilliz Cloud BYOC 版本,如此一来,用户便可以将数据存储在自己的网络中,同时又可以借助 Zilliz Cloud 的能力实现各种 AI 应用。

2024-03-06 17:46:59 270

原创 OpenAI 将在 2027 年实现人类水平的 AGI ?完整 PDF 流出……

除了开头提到的内容,该 PDF 还提到了去年被曝光的 Q*。这份 PDF 直接指出 Q * 的下一阶段就是 GPT-6,现已更名为 GPT-7,不过因埃隆·马斯克的一纸诉状被搁置。这是最近硅谷乃至整个科技圈都在讨论的热门话题,内容均源自一份名为《Revealing OpenAI’s plan to create AGI by 2027》的 PDF,细节相当炸裂。目前,对于这份 PDF 的真伪尚未有定论,毕竟其文档来源于一个名为「vancouver1717」的 X 账户,该账户并不活跃,只发过两条推文。

2024-03-04 19:09:08 493

原创 轻松管理基于 RAG 的知识库!RBAC 的最佳实践来了

而你的大型客户大概有 50 个,他们的数据量较大,在千万到亿不等,对数据隔离和服务稳定性有严格的要求,希望支持知识库数据的对外集成。在管控层,角色掌管集群、项目、用户和账单等资源的操作权限,而在数据层,角色则专注于控制对 Cluster 数据的增、删、改、查的能力。针对小型客户,我们建议创建共享集群以节省成本,相同结构的文件,存储在同一个 Collection 下,每个客户以 Partition Key 做数据隔离,客户搜索时,仅返回该 Partition Key 下的数据。

2024-03-01 16:48:27 809

原创 揭秘「 B 站最火的 RAG 应用」是如何炼成的

作为一个史料的 RAG 应用,我们希望能够在给出包含知识的原文同时能够给出它在原文中的具体传记名,由于语料中可以通过格式区分出来传记名和正文,所以通过简单的一些规则就可以提取出来每个段落对应的传记名,并且通过将其作为文本的 metadata。当然,对 RAG 的质量评测通常是一个很复杂的系统工程,尤其是在缺乏数据标注的情况下,所以我们采用的是针对个例具体分析的方法来进行调优,根据“奥卡姆剃刀”法则,如果我们针对的个例的调优是简洁优雅的情况下,那针对大部分其他案例都会带来改善,我们先试着把这个问题给处理好。

2024-02-28 16:20:59 369

原创 远超 IVF_FLAT、HNSW,ScaNN 索引算法赢在哪?

Milvus 从 2.3 版本开始,在 Knowhere 中支持了 ScaNN 算法,在各项 benchmark 中有着不俗的表现。例如,在 Cohere 数据集 Recall 约 95% 的时候,使用 Knowhere 2.x 版本端到端的 QPS 是 IVF_FLAT 的 7 倍,HNSW 的 1.2 倍。Faiss 实现的 ScaNN,又名 FastScan,它使用更小的 PQ 编码和相应的指令集,可以更为友好地访问 CPU 寄存器,展示出优秀的索引性能。

2024-02-27 17:31:42 405

原创 2024 年,向量数据库的性能卷到什么程度了?

此外,我们还在探索使用新的 AMX 指令集。它根据给定数据集的分布、提供的查询和硬件配置自适应选择最合适的策略,可以满足用户对搜索质量的需求的同时实现最佳性能。Cardinal 是 Zilliz 专门研发的多线程、基于 C++ 语言开发的向量搜索引擎,其整合了最实用、最流行的 ANNS 方法,使用 Cardinal 可以实现高效的计算资源使用率。优化后的计算内核可能比一个简单但未优化的内核速度提升 2-3 倍,这可能进一步转化为 2 倍的 QPS 值,又或是在云主机机器上降低 20% 的内存要求。

2024-02-22 18:06:35 984

原创 揭秘 LLMs 时代向量数据库的 3 大实用场景

相比基础的 top-k 搜索,Rang Search 能够在一定距离内找到与目标相似的所有向量(分子),提供所有在此范围内的相关搜索结果,而不仅仅是固定数量的结果。以客服机器人为例,机器人会收到许多不同的信息,包含原始知识库、用户的所有提示、用户上传的图像、音频片段、回复内容等,这些都存储在 Zilliz Cloud 中以便进行快速检索。此外,新发布的 Cardinal 搜索引擎中进行了多方面的性能优化,包含 Zilliz 自研的向量索引、机器代码级别的计算优化,以及优化缓存感知算法等。

2024-02-21 17:20:33 552

原创 Zilliz Cloud 再发新版本:性能提升超 10 倍,AI 应用开发流程再简化!

Zilliz 一直致力于为用户提供开箱即用的数据集成解决方案,近期,我们便通过引入 Confluent 和 Airbyte Connector,扩展了 Zilliz Cloud 数据对接和转换能力。通过 RBAC 功能,企业用户可以实现对数据访问进行细粒度的控制,提高数据安全性和合规性,同时促进团队间的协作,并确保用户根据其角色和职责拥有对应的访问权限和级别。支持 Parquet 文件:提升数据处理能力,支持 Parquet 文件,通过其高效的列式存储格式,提供更好的查询性能,适用于具有复杂数据集的场景。

2024-02-19 17:13:52 921

原创 Zilliz 年度印象:未来独角兽?RAG 首选?LLM 记忆体?

我们业务部门从 2023 年引入深度学习模型,也增加了 LLM 模型业务线,产生了向量的需求,且这个量到现在已经过亿级了,当时手头没有能做向量检索能力的数据库,在和部门同事的对比下选择了 Milvus,产品和社区也确实没有让我们失望,经过一段时间的试用我们向业务交付了向量数据库。从我自己的角度(可能我还不算专家)会去问很多细节的问题,他们都有做详细的回答并且以测试报告的形式打消疑虑,也建立了专属的联系渠道方便快速找到他们,并做了相对长时间的 POC 来保证产品确实能满足业务的诉求。还等什么,开抢吧朋友们!

2024-02-06 16:10:57 778

原创 RAG 新路径!提升开发效率、用户体验拉满

这样的整合方案,为解决企业级应用面临的挑战提供了新的视角和解决路径,预示着 RAG 技术的应用将更加广泛和深入,为开发更加智能、更加用户友好的应用提供了可能。另外,Zilliz Cloud 在面对数据量增长时,系统能够无缝地扩展资源,保持高性能的稳定输出,从而让 AI 应用的开发者和企业用户,能更加专注于业务本身,而不是后端设施的管理和优化。这对于那些需要实时回答复杂查询的应用来说具有极大的优势,加入 Milvus 能使 RAG 应用能够在竞争激烈的市场中更有优势,提供无缝、快速的用户体验。

2024-02-05 14:52:46 576

原创 深度解读 BigANN 2023 四大赛题,向量搜索还有更好的解决方案?

在图搜的过程中,一般需要一个数据结构来标记哪些点被访问过,传统的方法是使用一个 bitset 或者哈希表,bitset 的缺点是其中大部分的内存并不会被使用到,使得每次读取时会有大概率的 cache miss;不止如此,Zilliz 认为 BigANN 此次的赛道设置非常具有生产指导价值,无论是支持 Filters、Sparse 这样多元化的搜索方式,解决 OOD 这个场景提出的“如何提高搜索质量”的问题,还是优化 Streaming 的生产常见场景,都是团队现阶段积极探索的方向。

2024-02-01 15:49:39 594

原创 点击查看 Milvus 社区十大关键词(下)

正常情况下,大家使用 info 等级就够了,在做一些问题 debug 的时候,才需要调成 debug 等级,debug 级别的日志会非常多,当你发现 Milvus 的日志非常多的时候,大概率是日志等级设错了。另外是关于使用单机版支持主从和多副本的问题,理论上是可以的,但是用户需要自己保证数据的一致性,以及主备间的 HA 切换,整体实现的难度可能比部署一个 Milvus 集群还要高不少。,可以做到一键式地导出集群所有日志,尤其是大家在提 issue 的时候,提供一份完整的日志对于问题的快速定位至关重要。

2024-01-30 16:16:51 50

原创 点击查看 Milvus 社区十大关键词(上)

如果在 issue 里面也没有找到,不妨创建一个类别为 feature request 的 issue,把你想要的查询功能详细描述出来,并说明其对应的使用场景,说不定下个版本里面就有你要的功能了。关于“调哪个”的问题,我认为是配置这三个问题中最难的,不同的使用场景下,要调的参数都是不同的。前文也提到,2023 是 AIGC 应用爆发的一年,在做 LLM 应用开发的过程中,大家能直观感受到大模型的响应时间是比较慢的,一般是几百毫秒到几秒。丝滑的入库体验,是影响开发体验的第一步,也是至关重要的一步。

2024-01-29 15:41:40 811

原创 手把手系列!无需 OpenAI 即可搭建 RAG 应用

在之前的文章中,我们介绍了 RAG 应用典型的技术栈——CVP(注:CVP 全称为 ChatGPT + Vector Database + Prompt as code,即 ”以 ChatGPT 为代表的 LLM + 向量数据库 + Prompt”)。本文搭建的 RAG 应用将在此技术栈基础上进行微调,将 ChatGPT 的 LLM 替换为 Hugging Face 上的 Embedding 模型,将 LangChain 用于管理 Prompt,并使用 Milvus 作为向量数据库。,用于加载环境变量。

2024-01-25 16:00:16 1029 1

原创 聊聊呼声较高的向量过滤搜索及其优化

范围不限于 Zilliz 的单个产品,也可以谈谈对 Zilliz 的商业动态、线下活动、内容平台的文章等印象,字数不限,入选用户将收获神秘礼物盲盒,欢迎来私~在 Milvus 社区中,这也是呼声比较高的功能。不过,很多用户反映,对于该功能的认知和使用方法仍心存疑惑。向量过滤搜索是一种基于条件的向量搜索方法,常用于推荐系统和信息检索等领域,能够帮助用户快速找到在给定条件下与其查询相关的内容。为此,本次直播,我们邀请到了 Zilliz 高级软件工程师许维芷,他将为大家一一解答。

2024-01-23 17:29:34 368

原创 「回看 Milvus 的 2023」:AI 热潮中的非典型向量数据库

与过去的方法不同,VectorDB bench 现在专注于真实世界的数据,包括更接近实际嵌入模型的数据集(如最新的OpenAI嵌入和Clip数据集)、更广泛的测试场景(包括过滤、实时更新,删除)和更大的测试数据集(大多数当前的测试框架针对的是小而固定的数据点,如果某些 vectordb 在数据集上作弊可能会误导)。更重要的是,数据库是复杂的系统,不能像大型模型那样不透明,用户必须充分理解数据库本身才能找到最合理的使用的方式,开源的透明度对于用户来讲不仅意味着自由更意味着可控。新的一年,我们顶峰相见。

2024-01-22 17:56:11 381

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除