- 博客(893)
- 收藏
- 关注
原创 短语检索不等于BM25+向量检索| Milvus Phrase Match实战
它能让你的系统从只能简单理解语义,升级为 “必须包含某短语 + 带语义理解 + 可控 + 可解释”的可落地产品。要匹配同样结构的短语,中文通常需要更大的 slop,数值也更“稀疏”(例如 1、3、5、7…❌ BM25没有词序意识:只能找“connection”, “peer”,词序全乱。——slop 都是在控制“短语中各个词之间允许多远的距离、是否允许插词/倒序”。例如英文用 2,中文可能要 5 才能覆盖到同一类倒序+插词情况)。2. 你用了“英文习惯”的 slop 上限,对中文来说还远远不够。
2025-12-16 18:30:03
364
原创 如何优化英伟达CAGRA,实现GPU建图+CPU查询,成本效率兼顾| Milvus Week
其中,NN-Descent(Nearest Neighbor Descent)的核心是:如果节点u是节点v的近邻,且节点w是节点u的近邻,那么w有极高概率也是v的近邻,通过这种传递性可高效挖掘节点间的近邻关系。在每轮迭代中,为每个节点收集其当前邻居及邻居的邻居,形成候选邻居池,计算候选节点与目标节点的相似度。这种剪枝机制的优势在于,每条边的冗余判断仅依赖于其两端节点与共同邻居的距离计算,无跨边的数据依赖关系,可通过GPU批量并行执行,在不损失检索精度的前提下,将。88.9 倍性能飙升!
2025-12-08 18:18:00
792
原创 88.9 倍性能飙升!JSON Shredding 让 JSON 查询告别全表扫描| Milvus Week
如果你的查询条件没有被单独成列,那基本表明这些要查询的键值对是稀疏的,系统直接在Shared 列中查找,由于已经有基于Key 的倒排,也能很快定位这些查询Key 哪些行中,过滤大部分没有命中的行。Json 中的任意一个Key 都会被分析处理,对于查询具有较强的通用性,可以覆盖用户的所有查询,不需要用户自己创建key,也不需要提前构建索引等。对于稀疏的一些键值对,系统会将其汇总全部放在一列共享列中,并对其做一些优化,针对其稀疏性,建立key 的倒排索引,实现对稀疏值的快速过滤。:将所有可能的字段提前定义好。
2025-12-01 18:10:28
772
原创 写在 Milvus4 万 Star 之际:Zilliz这七年如何走来,又要去往何处?
2024年,Milvus入选Forrester向量数据库"领导者象限",Star突破4万星的时刻,我们更加确信:AI基础设施没有弯道超车,Zilliz八年磨一剑的坚守,正是Milvus持续领跑的核心密码。从金融、制造、医疗,到政务、教育、运营管理,任何场景中非结构化数据的理解和利用,都能借助Zilliz Cloud的能力,立刻挖掘释放。2017年Zilliz成立时,那时候,行业还没有向量数据库的概念,我们率先提出了那个关键问题:向量逐渐成为AI时代非结构化数据的通用语义,那么我们究竟要如何高效的管理它?
2025-11-28 18:07:02
563
原创 RAG不会过时,但你需要这10个上下文处理技巧|Context Engineering系列一
目前,主流的架构范式是使用专门的多模态编码器来处理特定类型的数据,例如使用CLIP(Contrastive Language-Image Pre-training)模型来处理视觉信息,或使用CLAP(Contrastive Language-Audio Pre-training)模型来处理音频信息。例如,N-CRITICS框架采用基于集成(ensemble-based)的评估方法,让多个不同的模型或同一个模型的不同实例对初始输出进行评估,并汇总它们的反馈来指导精炼过程,从而获得更全面、更独立的评价。
2025-11-26 18:13:34
332
原创 RAG效果要提升,先搞定高质量Context Pruning
这样训练出来的模型,既能判断文档相关性,又能精准地做句子剪枝:推理时,Provence会给每个词打分,然后按句子聚合:如果一个句子里标记为1(相关)的词比标记为0(无关)的词多,就保留这个句子,否则就删掉。(Precision 62.35%,Recall 36.98%),在三个模型中相对较弱,显著低于Provence和XProvence,说明在out-of-domain场景下,模型输出的分数校准和泛化能力还有提升空间。更重要的是,这样生成的问题不会出现在任何模型的训练数据中,能够真实反映模型的泛化能力。
2025-11-24 18:18:50
322
原创 月活11亿的Reddit ,怎么选向量数据库:Pgvector、Redis、Milvus、Qdrant
最后,两款方案其实都满足了我们大部分需求,但考虑到Reddit 是一个依然在高速增长的平台,且未来的数据体量与运维难度还将节节攀升,选择Milvus 的更强扩展性,能让整体运行更放心,也更适配Reddit 公司的情况。最后,每个方案的总分会用方案在某项需求的得分乘以这项需求的权重,再加起来(比如 Qdrant 在 “重排序 / 分数合并” 这一项得 3 分,权重是 2,那这项就是 6 分,所有项都这么算再求和)。,一同进步,开源让客户自身也能深度参与、贡献代码的方案,这样一旦遇到问题,也自主快速修复。
2025-11-20 17:59:07
1044
原创 Milvus 落地顶级汽车资讯平台:如何支撑易车上亿用户的搜车需求?
(仅做变更数据同步,不做全量数据同步,不会影响业务),通过 Flink CDC 抓取 MySQL、SQL Server、MongoDB 等业务数据源变动,经 Kafka 传输、Flink Job 处理拼接、embedding 后,秒级推送至 Milvus 集群,延迟从 1 天降至秒级。对待召回数据生成相似问,提升召回率。,将文档、网页、图片等多源数据的清洗、加工、向量化封装成自动化任务,不仅保障了数据逻辑的一致性,还能充分利用大数据集群资源,提升数据处理效率,为 Milvus 提供了高质量的向量数据输入。
2025-11-18 17:57:26
489
原创 沃尔沃RAG实战:企业级知识库,早就该放弃小分块策略
此外,对于Milvus的选型,沃尔沃也没选择比较新的 PyMilvus v2 SDK 及其内置的embedding集成功能,而是选择了 SDK v1 中基于collection的旧版本,从而保证团队能够设计详细的元数据结构,并明确定义每种文档的存储、索引和检索方式。此外,针对格式繁多的非结构化数据,Milvus 支持的字段类型多达 64 种,这让沃尔沃不仅能存储嵌入向量,还能存储丰富的元数据 —— 从文档类型、来源到部门级分类等关键信息,覆盖全面。理由是,他们觉得较短的片段能带来更高的精度。
2025-10-29 18:16:00
1035
原创 先分块再向量化已经过时!先embedding再chunking才是王道
仅需调整 3 个核心超参数(最大分块大小、一二句之间的最低语义相似度需求、新句子与块内句子最大相似度的最低门槛),且超参数逻辑与分块大小自适应 —— 分块规模越大,新句子纳入的阈值越高。:计算当前分块 C 内所有句子向量间的最小 pairwise 余弦相似度,识别分块内语义最不相似的句子对,衡量分块内句子的关联紧密程度,进而判断新句子是否与分块内句子足够相似。核心决策逻辑为:若分块 C 内的最小相似度小于新句子与分块 C 的最大相似度,则新句子加入分块 C,否则开启新分块。(衡量新句子与分块的适配度);
2025-10-28 17:57:42
786
原创 DeepSeek-OCR解读:视觉如何成为长上下文压缩的新思路
更重要的是,在计算效率层面,会将在线处理复杂度大幅降低。而 DeepSeek-OCR 通过 文本→图像→视觉 token的转换,直接将计算基础从文本 token 转为视觉 token,相当于用更低复杂度的载体重构问题。例如处理含折线图的财报时,视觉 token 可保留数据趋势,解码器能直接输出可编辑的 HTML 表格,避免传统方案仅能提取图下文字说明的局限。简单来说,用视觉模态作为长上下文的压缩载体,DeepSeek-OCR在保证精度的同时,可以实现模型算力与效率的突破。
2025-10-22 18:54:15
1176
原创 大模型落地,已经走到了用上下文工程续命时刻
当你的AI应用需要从海量上下文中快速找到最相关的信息时,这种性能表现直接决定了用户体验的好坏。DeepMind在Gemini 2.5的技术报告中详细描述了这种现象:在Pokemon游戏实验中,AI智能体偶尔会产生关于游戏状态的错误判断,并将这些错误信息写入上下文。,甚至在完全不需要工具的场景中也会错误地尝试调用工具。从1KB的文本消息到100MB的视频片段,从简单的数值记录到复杂的嵌入向量。而且,基于“Lost in the middle”现象,大模型会给上下文的开头和结尾更高的权重,忽略中间部分内容。
2025-10-13 17:58:40
1090
原创 Filevine四亿刀融资跻身法律AI独角兽,背后的infra怎么搭
在Filevine看来,无论法律类AI还是更多行业的AI产品,其本质都不是取代传统人类,而是通过向量数据库等产品,来解决人类工作中的脏活、累活,以及多数无意义的案头工作。:一个案件通常包括数千份文件,包括法庭文件、诉状和命令、证词记录和专家证人陈述、历史案件档案和先例文件,此外,复杂的医疗记录,每个病人通常有数百页。在传统的法律工作流程中,律师60–80% 的时间,都被花在寻找、过滤、对齐法律条文以及各种信息上,每天消耗的时间至少6小时起步。,日均文件上传量超过 2,000 万页,总处理文档超十亿份。
2025-09-24 18:07:58
696
原创 百图生科:如何搭建针对50亿蛋白质序列、上亿文献的AI检索系统
生物数据形态多样,涵盖蛋白质结构、DNA 序列、细胞成像、科研文本等,生命科学的突破往往就藏在跨模态数据的关联中 ——比如生物体的DNA会影响其所能产生的蛋白质大类,而蛋白质结构与细胞病变之间也往往有着对应关系。基于稳定高效的基础设施,百图生科的目标是把技术转化为真正解决行业问题的可落地方案。具体路径上,通过大模型海量的生成、预测与优化能力,AI几乎可以生成无限药物组合可能,去针对过往未被考虑的疾病治疗靶点,生成具有优化特性的新药物分子或生物制剂,辅助和优化传统制药中的高通量筛选和生成设计环节。
2025-09-23 18:07:55
1063
原创 索引选不对,成本贵十倍!HNSW与IVF如何做选型
如果采用了 PQ/SQ8 压缩,如果采用了 PQ/SQ8 压缩,系统会用查表法(lookup table method) 来加速距离计算:在查询开始时,预先计算查询向量与码本的距离,之后只需“查表+加和”即可快速得到近似距离。读者(查询向量)进门不用瞎转,直接锁定最相关的 2-3 个区域,在小范围里找书,效率自然翻倍。它的核心思路是“先粗分,再细排”:通过 k-means 聚类将海量高维向量划分到不同簇中,查询时只需进入最相关的少量候选簇,既避免了全表暴力扫描,又能兼顾速度与精度。
2025-09-18 18:11:11
1444
原创 企业级向量数据库选型,Milvus 和Zilliz Cloud哪个更合适?
需要特别注意的是,对于多数新用户而言,Milvus 的自主运维需要一定的时间沉淀与技术认知积累,因此这类用户往往更倾向于选择商业化的 Milvus 产品(如云厂商托管版 Milvus、或者Zilliz cloud)。整体来说,通过灵活的机器类型、计算存储分离、降低的运维开销、AUTOINDEX 和弹性扩展,Zilliz Cloud 比自托管的 Milvus 更具成本效益,总拥有成本(TCO)可下降 50%以上。这些特性共同为您的组织带来了更高效、自动化和强大的向量搜索体验。
2025-09-17 18:23:11
1207
原创 报名倒计时丨9月20日Milvus社区北京Unstructured Data Meetup
Unstructured Data Meetup 以非结构化数据和 GenAI为主题,面向开发者的技术分享线下聚会,该活动源自硅谷,由向量数据库领先者 Zilliz 创办。活动受众包括,AI工程师,数据科学家,大数据工程师,AI产品经理等群体。通过 Unstructured Data Meetup,让更多非机构化数据和 GenAI 开发者共聚一堂,共同探索非机构化数据和 Gen AI 的最新进展及演进方向。快扫描下方二维码报名参加,让我们一起开启非结构化数据的新篇章,探索 AI 的无限可能!
2025-09-15 18:11:52
413
原创 Meta如何给RAG做Context Engineering,让模型上下文增加16倍
Meta 团队在 Slimpajama(书籍、arXiv 领域)、PG19、Proof-Pile 等主流数据集,以及 RAG、多轮对话、长文档摘要等任务中对 REFRAG 进行了全面验证,其优势主要体现在效率提升、上下文扩展、场景适配三个维度。同时,因为 LLM 是自回归生成的(依赖前文 token),REFRAG 的方法保证了原始 token 仍能参与生成,不破坏上下文连续性。目标是让解码器基于压缩上下文(编码器输出)的生成结果,尽可能接近基于完整上下文的结果,为下游任务(如 RAG)奠定基础。
2025-09-12 19:08:21
1354
原创 Milvus × 蜜度:如何基于向量数据库构建全网多模态舆情监控系统
对于蜜度来说,舆情管理的核心之一是热点图像数据处理,虽然数据底库的总量不大,只有几十万,但是需要扛住上千的并发访问,为此,蜜度采用了Milvus的内存多副本特性,在load 集合的时候加载了 50 多个副本,从而达到了5000+的qps。作为一家以语言智能与垂直大模型为核心的AI企业,蜜度科技一直服务于政企与媒体客户,提供高效、智能、安全的信息处理解决方案。例如,我们可以同时用向量搜索找出“语义相似”的图片,同时叠加时间范围、区域、事件标签等属性过滤器,从而实现更贴近用户业务的检索逻辑。
2025-09-10 18:10:55
792
原创 实测|Perplexity最新AI浏览器产品Comet,真正的agent全家桶!
Comet不仅找到了标记为"good first issue"的入门级任务,还根据难度和技术领域进行了分类,并提供了每个issue的简要描述和解决思路。同时,直接的协议控制也提供了更精细的页面状态管理能力.比如,面对Milvus这样复杂的开源项目时,让开发者不再需要在数百个GitHub页面间来回跳转,花费数小时阅读文档却仍然一头雾水,让复杂的技术学习变得像与ChatGPT对话一样简单?Milvus是全球领先的开源向量数据库产品,其快速迭代和高活跃度,带来了许多独特的新版本特性和众多复杂的产品概念。
2025-09-09 17:59:59
1561
原创 英伟达新论文:多数LLM应用等不到盈利,SLM比LLM更适合做agent
此外,小模型针对特定任务微调的难度与效果也往往更优,更重要的是大模型的泛化能力,应对的是复杂输入,但是agenticAI存在的必要性,即在于把复杂任务拆解成一系列简单可执行的子任务。部署 “数据采集工具”,记录智能体所有 “非人机交互(non-HCI)的模型调用”—— 包括输入给 LLM 的提示词(prompts)、LLM 输出的响应、智能体调用外部工具(如计算器、数据库)的具体内容,还可以有选择的记录 “响应延迟”(为后续优化速度做准备)。也是因此,坚持“事事都用 LLM”,实质上是在错配算力,
2025-09-04 18:07:01
783
原创 报名开启丨9月20日Milvus社区北京Unstructured Data Meetup
Unstructured Data Meetup 以非结构化数据和 GenAI为主题,面向开发者的技术分享线下聚会,该活动源自硅谷,由向量数据库领先者 Zilliz 创办。活动受众包括,AI工程师,数据科学家,大数据工程师,AI产品经理等群体。通过 Unstructured Data Meetup,让更多非机构化数据和 GenAI 开发者共聚一堂,共同探索非机构化数据和 Gen AI 的最新进展及演进方向。快扫描下方二维码报名参加,让我们一起开启非结构化数据的新篇章,探索 AI 的无限可能!
2025-09-03 18:00:41
547
原创 向量检索快比LLM还贵?不支持S3的向量数据库,迟早要淘汰!
先粗略查一批,再按条件筛 —— 好处是好实现,能利用统一的底层索引结构,缺点是在过滤条件较多时,TopK 结果可能严重不足(我们测到删除 50% 数据后,TopK 20 只能返回 15 个结果)。现如今,S3自身的定位,从简单的对象存储升级成为了一个多模冷存储,不仅仅是向量,图,KV,时序等多种模态,未来常见的业务几乎都可以通过S3Table的模式加速。在我们看来,在 AI 应用里,数据不应该被粗暴割裂成在线和离线,很多情况下,他们是随时动态转化的。因此,过去向量数据库最在意的召回速率,反而不再重要。
2025-09-03 18:00:41
1008
原创 Zilliz Cloud功能上新:智能扩缩容上线, SSO 、Audit Log再升级
关于 Zilliz Cloud 安全与合规实践的更多内容,可访问 Zilliz 信任中心(Zilliz Trust Center)https://zilliz.com/trust-center。功能上,Milvus 2.6 延续并加强了 2.5 版本引入的全文检索功能,进一步强化了搜索功能,并整体升级底层架构以满足更严苛的性能、成本与规模需求。此外,开源的Milvus 2.6 的所有功能,也在此次Zilliz Cloud功能升级中迎来内测(如有需要,可联系对口销售即可开通)。
2025-08-27 18:06:09
771
原创 闪灵AI :如何靠AI视频检索,让小团队广告提案生产效率提升十倍
过去,在创意环节,广告公司想给车企想拍一支科技感汽车穿梭山林的 TVC方案,光找参考素材也得耗掉一整天:视频平台素材效果参差不齐,硬盘里的优秀历史素材,想找到最精准的画面片段,找文件夹、拖拽时间轴也要耗费不小的时间精力。低频冷数据存在S3对象存储,保持低成本。一开始,闪灵AI使用的是开源 Milvus 搭建检索系统,能实现输入文字或图片,毫秒级匹配相似视频片段的效果,但随着素材量增长到近 1000 万向量、二三十万条视频,新的问题出现了:自己搭集群太吃内存,一台服务器根本扛不住,而且运维成本特别高。
2025-08-26 18:24:53
663
原创 直播预告丨从码农到 B 站百万播放 KOL!技术人转型传播秘籍大公开
为了方便大家的交流以及技能的分享,我们组织了北辰使者说这个栏目。两位嘉宾会结合真实经历,从 “如何与 Milvus 结缘、开启社区参与” 讲到 “码农必备的 KOL 意识”,更会揭秘百万播放爆款《鲁迅说没说》(直播最后还设有 Q&A 自由讨论环节,你可以现场提出技术传播、开源参与的困惑,与嘉宾深入交流,找到适合自己的转型方向。同时,还会分享 Milvus 北极星计划的参与体会,给想入局开源与技术传播的朋友实用建议。欢迎大家锁定直播间,和我们一起解锁技术人 “破圈” 新路径,让你的技术价值被更多人看见!
2025-08-19 18:01:11
436
原创 Word2Vec、 BERT、BGE-M3、LLM2Vec,embedding模型选型指南|最全
混合类型” 是近年的创新方向,如 BGE-M3 能生成包含稠密向量、稀疏向量,以及多向量表示 —— 即使文本中未出现 “机器学习”,模型也能通过语义推理在向量中赋予该术语一定权重,既保留了关键词匹配的精确性,又增强了语义理解能力。稀疏向量:通过线性变换与 ReLU 激活,生成包含 “相关术语权重” 的稀疏表示,即使文本中未出现某术语,模型也能通过语义推理赋予其权重(如 “iPhone 新品” 会关联 “苹果公司”“智能手机” 等术语)。Embedding 的本质是从非结构化数据到计算机语言的 语义翻译。
2025-08-15 18:04:41
992
原创 报名倒计时丨8月23日南京Unstructured Data Meetup火热招募中
Unstructured Data Meetup 是以非结构化数据和 GenAI为主题,面向开发者的技术分享线下聚会,该活动源自硅谷,由向量数据库领先者 Zilliz 创办。我们致力于通过 Unstructured Data Meetup,让更多非机构化数据和 GenAI 开发者共聚一堂,共同探索行业最新进展。快扫描下方二维码报名参加,让我们一起开启非结构化数据的新篇章,探索 AI 的无限可能!8月23日,南京场Unstructured Data Meetup 将在。日13:00-17:30,
2025-08-13 18:12:06
358
原创 LLM、RAG、workflow、Agent,大模型落地该选哪个?一个决策矩阵讲透
当任务满足 “三可” 条件 —— 可拆解(子任务间耦合度越小越好)、可验证(每个子任务结果可独立校验)、成本可控(预期 ROI够高,可以打平token消耗成本)时,可尝试 multi - agent;以智能客服为例,可通过 Workflow 实现 “用户提问→意图识别→任务分配” 的标准化分流,再让 Agent 处理具体任务中的动态决策(如 根据用户历史订单推荐退款方案),依此降低人工干预频率,兼顾稳定可控与场景适应能力。若仅是处理单篇长文档(如万字报告分析)且对成本不敏感,可短期依赖长上下文大模型。
2025-08-13 18:12:06
1350
原创 最佳实践|Zilliz 如何助力MiniMax的AI落地与预训练数据管理
但通常来说,这数百亿文档中会存在大量重复冗余内容,不仅浪费计算资源,更导致大模型反复“咀嚼”相同的知识,在重复内容上过拟合,降低了对新信息的泛化能力。其中,MinHash 负责将文档压缩为签名(目前,MinHash 向量,需要用户自己生成),LSH 负责高效缩小搜索空间,从而快速定位潜在重复,帮助企业完成百亿级语料下的预处理优化。更关键的是,这些数据并不是静态的。为此,我们不仅需要更大的计算资源,也对非结构化数据的管理提出了更高的要求,对应的数据存储、处理、传输和检索系统升级已经迫在眉睫。
2025-08-06 18:53:25
968
原创 Milvus × 联想:向量数据库如何让制造业库存周转率提升10%
要补的话,补多少才合适?早期我们主要靠人工加正则表达式,从这些描述里提取关键词来判断机型,但部分物料的模糊匹配准确率并不理想,而随着物料越来越多、描述越来越乱,这套方法不仅效率低,出错率还不小,维护起来也特别头大。更重要的是,大家不仅能回忆当初,还能基于数据做出更扎实的总结和判断,帮助采购团队精准制定补货策略,避免缺货风险,同时控制好库存规模,提升资金效率。有了这个基础,不管是老物料还是新物料,只要录入信息,就能通过相似度检索快速找到最像的那类物料,然后一键分类搞定,效率和准确率都上了一个台阶。
2025-07-31 18:11:59
1294
原创 Milvus北辰使者的来信:Milvus Workshop是什么,我们为什么做这件事
Milvus Workshop 通过提供结构化、动手实践的学习体验,为用户在其 AI 和 ML 项目中充分利用 Milvus 提供了入门指南。它通过提供丰富的教程、示例代码和实践项目,降低 Milvus 的学习门槛,帮助开发者更高效地掌握和应用向量数据库技术。社区协作需求:开发者希望有一个开放的平台,可以分享 Milvus 的使用经验、案例和最佳实践。促进社区协作:鼓励开发者贡献自己的案例、工具和经验,打造一个活跃的 Milvus 学习社区。Milvus 的崛起与社区需求。Milvus北辰使者。
2025-07-25 18:25:43
1076
原创 直播预告丨运维部署有妙招!Milvus 稳定运行秘籍大公开
刘川丰将结合实战经验,详解 Milvus 运维部署的最佳实践,助力大家解决日常运维中的痛点问题,让 Milvus 运行更稳定高效。欢迎大家锁定 Zilliz 视频号直播间,和我们一起探索 Milvus 运维部署的门道,提升 Milvus 使用体验!客户催上线,老板一句“今天下班前搞定”,你却要手动改一堆 YAML、调资源、配高可用、还得盯着监控别挂了服务?更有自由讨论环节开放提问,现场提出在 Milvus 运维部署中遇到的困惑,与讲师深入交流。7 月 31 日 20:00-21:0。
2025-07-24 20:15:40
406
原创 ES vs Milvus vs PG vector :LLM时代的向量数据库选型指南
但只有开源是不够的,大型开源项目的迭代维护是需要很高的人力投入,单靠个人开发者几乎无法支撑,业界知名的数据服务相关的开源项目,比如Spark、MongoDB、Kafka,背后都是有成熟的商业化公司在运营。在此基础上,VDB的商业化方案,则应该保持云中立,在保证弹性、低运维投入的基础上,能满足不同业务、不同地区产品,以及不同阶段企业的多样化需求。Top-K相似性检索是最常见的向量检索需求,但除此之外过滤检索、阈值检索、分组检索和混合检索,也是一个企业级向量数据库的必备功能。互联网时代,关系型数据库为王。
2025-07-17 19:31:50
1257
原创 实战|从grok4与kimi2谈谈,大模型进入十万亿训练数据时代,如何做数据查重
但一个问题是,来自公域互联网的这些预训练数据中往往会存在大量重复冗余内容,如果将其一股脑不加选择的用于预训练,不仅浪费计算资源,更会导致大模型反复“咀嚼”相同的知识,在重复内容上过拟合,降低了对新信息的泛化能力。根据IDC的预测,到2027年,全球范围内,没有统一格式、缺乏明确定义字段的非结构化数据,总量将达到近250ZB,占比达到整体数据总量的86.8%。(2)能用上Minhash LSH的场景,通常是针对百亿、千亿甚至万亿数据的查重,这对服务背后的性能、工程化能力全都提出了极为苛刻的要求。
2025-07-15 20:17:04
1257
原创 直播预告丨解锁运维部署最佳实践,让你的 Milvus 更稳定!
刘川丰将结合实战经验,详解 Milvus 运维部署的最佳实践,助力大家解决日常运维中的痛点问题,让 Milvus 运行更稳定高效。欢迎大家锁定 Zilliz 视频号直播间,和我们一起探索 Milvus 运维部署的门道,提升 Milvus 使用体验!客户催上线,老板一句“今天下班前搞定”,你却要手动改一堆 YAML、调资源、配高可用、还得盯着监控别挂了服务?更有自由讨论环节开放提问,现场提出在 Milvus 运维部署中遇到的困惑,与讲师深入交流。7 月 31 日 20:00-21:0。
2025-07-14 19:05:14
525
原创 推出了四个MCP后,我们发现MCP的落地速度已经赶不上吹牛速度
目前已经支持使用英语、中文、西班牙语等语言与数据库交互,例如:“查找与该产品描述相似的文档” 或 “创建一个存储 512 维图像嵌入的集合”,“创建一个免费的 Milvus 集群”,用户无需打开控制台,也不需要配置细节,即可获得即用型数据库实例。更直白来说,MCP本身很好,但大模型在精准理解人类意图环节就出了问题,或者大模型本身在执行过程中有幻觉,那MCP自然也无法满足需求。开发成本降低,大模型的工具使用能力增加,过去一些繁琐专业的操作,可以借助大模型以自然语言交互的方式来完成。
2025-07-08 18:35:16
792
原创 超级黑马Read AI如何在美国把会议转录做成一门大生意
Assistant(会议助手):自动加入 Zoom、Meet、Teams 等会议,实时收集发言、注意力、情感、发言频率等互动数据,自动记录每个发言人的“语气”和“情绪走势”(这是其核心功能,也是其争议来源)。Read AI 选择扩充其产品矩阵:日历同步、CRM同步、邮件汇总、即时通讯汇总、视频会议汇总功能依次上线,基于以上数据,Read AI又推出了会议总结、会议分析、多平台信息检索等功能,从前,用户要自己提问,才能得到回应。此外,用户要的不是原话,而是理解:他想知道,客户是不是在动摇;
2025-07-07 18:48:33
1083
原创 我们是向量数据库的领军企业,我们在等你来
回顾历史,过去四十年的PC时代,如何更好的管理基础数据,诞生了Oracle这样三万亿(RMB)市值的巨头;目之所及,所有你听过的全球知名企业:英伟达、苹果、OpenAI、PayPal、AWS、微软、Google、阿里云……2. 精通Pulsar/Kafka/RabbitMQ、Etcd/Zookeeper等主流中间件系统的应用、排障、调优,并具备一定的二次定制能力。很显然,面对人工智能这样一个更广阔的市场,非结构化数据这样一个更大的蓝海,我们关于未来的想象力,不止于此。
2025-07-03 18:46:00
1253
原创 深度分析 | 自动驾驶数据挖掘的三座大山与向量数据库胜负手
在自动驾驶算法持续迭代的背景下,Zilliz 允许对已有数据的 embedding 进行批量替换,配合 alias 机制可帮助业务在无感切换模型的同时保持数据查询的稳定性:Zilliz 支持同时写入由不同模型生成的向量,并可通过混合搜索(hybrid search)对多向量列进行检索,为模型对比和联合分析提供便利。同一时期,作为国内智驾投入最为激进的车企,小鹏正式宣布,面向智驾经验用户即刻推送无限XNGP智能辅助驾驶功能,并且,该功能将不限城市、不限路线,有导航的地方就能使用。
2025-07-03 18:46:00
1351
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅