- 博客(184)
- 资源 (1)
- 收藏
- 关注
原创 Prompt、Agent、Skill、MCP、Claude Code 到底啥区别?
【AI系统架构解析:用"开公司"类比理解核心概念】 本文通过"开公司"的类比方式,清晰解析了AI系统的层级架构和核心概念差异。底层LLM是公司的"核心人才";Prompt如同临时口头指令;Agent则是自主执行任务的"员工";Skill相当于标准化SOP手册;MCP是连接外部资源的"门禁卡";Cursor等IDE工具是通用办公场地,而ClaudeCode则是专攻代码的"特种兵"。
2026-03-11 14:15:17
386
原创 一文搞懂什么是 Skills?
Claude推出Skills功能模块,通过预置脚本和模板实现任务自动化执行,相比传统方式效率提升40%。Skills与MCP形成互补关系,前者专注任务执行,后者负责系统连接。目前提供12个开源Skills案例,支持自定义开发。这一创新标志着AI应用正从提示词工程转向模块化能力复用,未来企业竞争力将取决于Skill库的丰富度和适用性。
2026-02-09 21:52:59
936
原创 LangGraph:状态管理与条件路由(二)
本文深入解析LangGraph中的状态管理与复杂流程控制技术。核心内容包括:1)State设计模式,通过不可变状态和增量更新实现可预测的数据流转;2)条件边机制实现基于状态的动态跳转;3)利用异步节点和聚合节点处理并行任务;4)错误处理与重试机制增强系统鲁棒性。最后通过多轮对话订单助手案例,综合展示了槽位填充、状态记忆等功能的实现方法。这些技术共同构成了构建高效、可靠AI工作流的基础框架。
2025-11-18 10:12:09
1086
2
原创 LangGraph:核心概念与简单对话流程(一)
摘要: LangGraph是一个基于大语言模型(LLM)的工作流编排框架,通过图结构组织任务节点和状态流转,支持复杂控制逻辑(如条件分支、循环)。核心组件包括State(共享状态对象)、Nodes(处理单元)和Edges(转移规则),适用于智能客服、数据分析等场景。本文详细介绍了安装步骤、核心概念,并演示了一个对话系统示例:用户输入经意图识别节点(调用DeepSeek模型)路由至对应处理节点,生成响应。LangGraph的图结构设计使其特别适合多轮交互和动态决策应用。
2025-11-18 10:07:53
1518
原创 Pydantic AI:多智能体应用开发(六)
本文介绍了基于PydanticAI的多智能体应用开发指南,主要内容包括: 多智能体应用分类:从单智能体到基于图的控制流四个复杂度级别 智能体委托开发:通过joke生成示例展示主智能体将任务委托给专业智能体的实现方式 程序化智能体交接:以航班预订系统为例,展示应用程序代码控制多个智能体执行顺序的方法 复杂系统实现:构建完整的机票预订系统,包含航班搜索、座位选择和订单确认流程 最佳实践:强调单一职责、接口清晰、错误处理和资源管理等设计原则 文中通过具体代码示例演示了依赖传递、使用量统计、消息历史维护等关键技术点
2025-11-17 16:35:39
1464
原创 Pydantic AI:模型上下文协议 (MCP)(五)
模型上下文协议(MCP)是一种标准化接口协议,支持AI应用程序与外部工具服务的无缝集成。MCP定义了客户端(如PydanticAI代理)与服务器端的标准通信方式,支持stdio、HTTPSSE和可流式HTTP等多种传输协议。PydanticAI既可作为客户端连接各类MCP服务器(如计算服务、天气服务等),又能作为服务器提供AI能力。协议支持工具调用自定义、命名空间隔离、TLS/SSL安全配置等高级功能,并创新性地实现了采样机制(服务器使用客户端LLM)和信息诱导(结构化输入请求)。MCP显著提升了AI系统的
2025-11-17 16:26:03
1275
原创 Pydantic AI:工具集详解(四)
PydanticAI中的工具集(Toolset)是一种强大的工具管理机制,允许开发者批量管理、组合和动态配置AI代理(Agent)的工具。工具集支持四种注册方式(构建时、运行时、装饰器和上下文覆盖),并提供三种工具添加方法(构造函数、装饰器、动态添加)。通过组合、过滤和重命名工具集,可以实现复杂的功能组合。高级功能包括动态工具定义、执行包装器(如日志记录和缓存)以及多模态支持(如图像处理)。本文以电商客服系统为例,展示了工具集在实际应用中的价值,包括产品查询、订单管理和客户服务等功能的集成。工具集机制使AI
2025-11-17 16:19:14
621
原创 Pydantic AI:函数工具详解(三)
PydanticAI函数工具详解 PydanticAI的函数工具系统为LLM模型提供了强大的现实交互能力,核心价值包括: 能力扩展:突破纯文本限制,支持执行具体操作 实时数据:获取训练时未知的最新信息 确定性操作:结合AI推理与程序逻辑 系统集成:连接数据库、API等基础设施 工具注册机制: 装饰器方式:@agent.tool(需上下文)和@agent.tool_plain(纯函数) 构造函数注册:通过Agent的tools参数批量注册 支持Pydantic模型定义复杂参数结构 高级特性: 多模态输出:支持
2025-11-17 15:23:46
1004
原创 Pydantic AI:依赖项系统详解(二)
本文介绍了PydanticAI中的依赖注入系统,该系统采用类型安全的方式为AI代理提供所需的外部服务和数据。主要内容包括:1)依赖项的定义与注入机制,推荐使用数据类组织复杂依赖;2)通过RunContext在系统提示、工具和验证器中访问依赖项;3)同步/异步依赖项的使用场景与实现方式;4)测试时依赖项覆盖的方法;5)SQL生成和多模态应用等实际案例。该系统遵循Python最佳实践,支持类型提示,使应用易于测试、维护和扩展。文章通过丰富代码示例展示了如何构建类型安全、模块化的AI应用,特别适用于使用qwen系
2025-11-17 14:30:36
939
原创 Pydantic AI :从安装到智能体开发(一)
PydanticAI是一个由Pydantic团队开发的Python框架,用于快速构建生产级生成式AI应用。该框架支持主流模型(如阿里云Qwen系列),提供类型安全、无缝监控和可靠执行等特性。文章详细介绍了安装配置、基础使用(同步/异步运行)、工具集成、流式输出、多模态处理(图像理解)、配置优化和实际应用案例(如数据分析助手)。PydanticAI通过依赖注入、结构化输出和错误处理等机制,使开发者能够轻松构建复杂AI工作流,特别强调生产环境的可靠性和开发者体验。
2025-11-17 13:55:19
1597
原创 CrewAi多模态AI实战:集成图像、音频分析的智能体系统构建(六)
本文介绍了一个多模态AI智能体系统的设计与实现。该系统能够综合处理文本、图像和音频数据,通过视觉分析工具、音频处理工具和多模态融合工具实现跨模态信息整合。文章详细阐述了技术架构、工具开发、智能体设计以及实战项目案例,包括多媒体内容分析平台的具体实现。系统采用模块化设计,支持实时流处理和性能优化,并提供容器化部署方案。同时探讨了模态对齐、计算资源和数据隐私等技术挑战的解决方案,最后展望了多模态AI在更多模态支持、实时交互和领域专业化等方面的发展方向。该系统为构建更智能、更接近人类感知方式的AI应用提供了实践参
2025-11-14 17:01:01
875
1
原创 CrewAI项目实战:多智能体协作的市场分析平台开发(五)
AutoInsight是一个基于AI智能体的自动化市场洞察报告生成平台,通过多智能体协作实现一键式市场分析服务。系统采用模块化架构设计,包含首席研究员、市场趋势分析员、竞品侦查员、战略顾问和报告合成专家5个智能体角色,分别负责研究框架制定、市场趋势分析、竞争情报收集、SWOT分析和报告整合。技术栈采用FastAPI后端+Streamlit前端,集成通义千问大模型和Serper搜索API,实现从数据收集到报告生成的全流程自动化。项目亮点在于完整的端到端解决方案和专业级报告输出,未来可优化多数据源集成和实时监控
2025-11-14 16:36:49
1039
原创 CrewAI高级流程与架构:构建企业级智能体协作系统(四)
本文系统介绍了CrewAI框架的高级流程控制与性能优化技术。首先分析了顺序流程和分层流程的优缺点,提出使用图式工作流(DAG)实现复杂任务编排,支持条件分支和并行执行。其次,详细阐述了错误处理机制,包括重试策略、熔断器和降级方案。在性能优化方面,提出了智能缓存和LLM调用批处理等方法,显著提升系统吞吐量。最后强调生产级应用需要实现可靠性、性能、可维护性和扩展性的平衡,建议采用渐进式复杂化和监控驱动的优化策略。这些技术使AI智能体能够组成真正高效的协作团队,而不仅是简单任务序列。
2025-11-14 16:32:27
669
原创 CrewAi:工具(Tools)与记忆(Memory)系统(三)
本文系统介绍了如何通过工具(Tools)和记忆(Memory)系统增强AI智能体的实用能力。工具系统赋予智能体与外界交互的能力,包括内置工具(如搜索引擎、计算器)和自定义工具(如股票查询、天气API),可针对不同角色分配专业工具包。记忆系统使智能体能记住对话历史,在多轮交互中保持连贯性,支持智能体级和团队级记忆配置。文章通过智能投资分析团队的完整案例,展示了数据收集员、市场分析师和投资顾问的协同工作流程,配备专业工具链和记忆系统,实现从数据收集到投资建议的端到端分析。最佳实践部分强调了工具错误处理、记忆优化
2025-11-14 16:26:25
1364
原创 CrewAi:Agent、Task、Crew 的详细拆解(二)
本文深入解析了CrewAI框架的三大核心组件配置方法。在Agent配置方面,强调角色定义的明确性、目标设定的可衡量性及背景故事的丰富性,建议根据不同需求选择适合的LLM模型和工具。Task设计需清晰描述任务内容,善用任务依赖关系,并明确预期输出格式。Crew团队组装应根据任务关系选择顺序或分层流程,合理配置团队参数。精细化配置虽然前期投入较大,但能显著提升执行质量、减少迭代成本,建立可复用模板。核心总结:配置精度决定输出质量,精细化的前期设计能够带来长期效益。
2025-11-14 16:22:16
844
原创 初识CrewAI:多智能体协作框架指南(一)
【摘要】CrewAI是一个开源的Python框架,专注于多智能体协作任务编排。它通过模拟真实团队分工,将不同角色(如技术专家、文案编辑)分配给特定智能体,按照序列化流程协同完成复杂任务。相比单智能体方案,CrewAI具有角色驱动、流程可配置等优势,支持顺序/并发等协作模式。示例展示了基于阿里云QWEN模型的技术写作团队构建过程,包含智能体角色定义、任务分配和顺序执行流程。该框架适用于需要多领域专业知识协作的应用场景,能有效提升复杂任务的处理效率和质量。
2025-11-14 16:17:56
992
原创 LlamaIndex:AutoGen智能体与RAG结合(十一)
本文提出一种融合AutoGen、LlamaIndex和Milvus的企业级智能助手架构,通过多智能体协作与检索增强生成技术解决复杂业务问题。系统采用三层设计:Milvus构建向量知识库,LlamaIndex处理文档解析与查询,AutoGen实现任务分解与多Agent协作。文章详细介绍了从环境配置、知识库搭建到智能体系统实现的全流程,包括文档加载、元数据处理、查询封装和权限控制等关键技术。该系统可支持跨部门复杂查询,如同时解答人力资源政策、市场预算和产品案例等问题,并具备动态权限管理和查询日志功能,适用于企业
2025-11-14 14:42:49
714
原创 LlamaIndex:LlamaIndex 与 Milvus 集成(十)
本文介绍了如何将LlamaIndex与Milvus向量数据库结合,构建高性能的企业级RAG系统。主要内容包括:Milvus作为专业向量数据库的特性与优势;通过LlamaIndex实现多模态文档转换和向量嵌入生成;配置LlamaIndex使用Milvus作为底层存储的详细步骤;以及实现高效语义检索和元数据过滤的方法。文章还对比了Milvus与默认存储的性能差异,并提供了索引优化和监控等进阶技巧。这种组合方案既保留了LlamaIndex的智能处理能力,又借助Milvus实现了大规模向量数据的高效存储与检索。
2025-11-14 14:36:39
808
原创 LlamaIndex:高级RAG技巧解析(九)
本文深入探讨了企业级知识库系统在高阶场景下的四种核心技术。首先介绍了查询路由技术,通过自动判断问题类型选择最佳处理路径,提升系统准确性。其次讲解了子查询与递归检索技术,将复杂问题拆解为小问题并逐层深入检索,解决复合型问题。随后阐述了Agent架构,使AI具备规划、工具调用和反思能力,实现主动决策。最后展示了如何整合这些技术构建智能化问答系统,根据不同问题类型自动选择最佳处理方式。这些方法显著提升了知识库系统处理复杂推理、多源整合和动态决策任务的能力。
2025-11-14 14:33:06
804
原创 LlamaIndex:构建企业级RAG知识库(八)
本文介绍了一个基于LlamaIndex构建的企业级智能知识库助手解决方案。该项目为虚构科技公司SmartAITech设计,支持PDF/Word/PPT/Markdown等多种文档格式加载,通过元数据标注实现部门级权限控制,采用本地LLM(Ollama)和嵌入模型(BGE)确保数据安全。系统具备文档解析、向量索引、多轮对话和Web界面(Gradio)等完整功能模块,从环境配置到最终实现提供了端到端的开发指导,帮助开发者将零散的LlamaIndex功能整合为可用、易用的企业级应用。
2025-11-14 14:29:10
868
原创 LlamaIndex:模块化设计(七)
本文深入讲解如何定制LlamaIndex的RAG系统核心组件,实现完全本地化部署。主要内容包括:1. 解析LlamaIndex模块化设计,介绍ServiceContext的核心协调作用 2. 替换默认LLM为本地Ollama模型,实现安全私有的文本生成 3. 切换嵌入模型为开源BGE系列,支持中英文向量检索 4. 自定义SentenceSplitter文本切分器,提升语义完整性 5. 完整实战示例展示全本地化RAG系统搭建 6. 提供最佳实践方案和常见问题解决方案 通过组件替换和参数调优,开发者可构建符合特
2025-11-14 14:21:52
1080
原创 LlamaIndex:深入理解节点后处理与元数据过滤(六)
文章摘要:本文探讨了RAG系统中检索结果不精准的核心问题——语义相关但上下文不匹配。针对这一挑战,提出了两种关键技术:元数据过滤(检索前缩小范围)和节点后处理(检索后优化结果)。文章详细讲解了如何使用部门、年份等元数据进行精确筛选,以及通过重排序、去重、阈值过滤等方法优化检索结果。通过Python代码示例,展示了如何构建高精度问答系统,实现从"语义相似"到"内容精准"的跨越。最后总结了最佳实践和常见误区,为提升企业级问答系统质量提供了实用解决方案。
2025-11-14 14:17:16
727
原创 LlamaIndex:ChatEngine 与复杂查询(五)
摘要:本文深入解析了LlamaIndex中的QueryEngine与ChatEngine核心区别,重点介绍了如何实现智能多轮对话。ChatEngine通过内置记忆模块(Memory)保存对话历史,解决了上下文理解问题,使AI能处理"那今年呢?"等指代性提问。文章详细演示了三种查询变换技术:SimpleQueryTransform规范模糊表达、DecomposeQueryTransform拆分复杂问题、HyDEQueryTransform通过假设答案提升检索效果,并提供了完整代码示例。最佳
2025-11-14 14:11:40
622
原创 LlamaIndex:不止是VectorIndex-选择最适合你数据的索引策略(四)
本文深入探讨了LlamaIndex中三种核心索引类型的特点与应用场景。VectorStoreIndex基于向量相似度检索,适合精确匹配的知识问答;SummaryIndex通过全局摘要实现整体性理解,适合报告总结和趋势分析;TreeIndex采用层次化结构,支持复杂推理和流程解析。文章详细解析了每种索引的工作原理、配置参数和代码实现,并提供了索引选择的实用指南。对于实际应用,作者建议根据数据类型和查询需求灵活组合不同索引,同时提出了数据预处理、参数调优等性能优化策略。掌握这些索引技术能够显著提升AI应用的响应
2025-11-14 14:06:43
916
原创 LlamaIndex:如何喂数据给LlamaIndex?数据加载器详解(三)
本文系统介绍了大语言模型应用中数据加载的核心技术与实践方法。首先强调"垃圾进,垃圾出"原则,指出数据质量对系统表现的决定性影响。详细解析了LlamaIndex的核心组件SimpleDirectoryReader的功能特点,包括自动格式识别、统一文档转换和元数据处理机制。针对PDF、Word等专业格式文件,阐述了专用解析器的使用技巧和最佳实践。同时介绍了网页内容抓取和数据库数据加载的解决方案,并提供了批量处理和内存优化的策略。最后通过企业级数据整合案例,演示了从多源数据接入到索引构建的完整
2025-11-14 13:58:42
2053
原创 LlamaIndex:深入理解三大核心组件:Document、Index 与 QueryEngine(二)
LlamaIndex数据流程解析:Document、Index与QueryEngine的协作机制 本文详细介绍了LlamaIndex框架中的三大核心组件:Document作为基础数据单元,存储文本内容与元数据;Index将非结构化文本转化为可检索的知识结构,支持多种索引类型;QueryEngine作为问答接口,结合检索与生成组件实现智能响应。文章通过代码示例展示了从数据加载、索引构建到问答服务的完整流程,并提供了元数据设计、索引优化等实践建议。该框架通过分层抽象实现了灵活的知识管理能力,为构建企业级智能问答
2025-11-14 13:48:57
852
原创 LlamaIndex:深入理解 LlamaIndex(一)
LlamaIndex是大语言模型与私有数据之间的智能桥梁,它解决了LLM的三大核心痛点:知识局限性、幻觉问题和上下文长度限制。该系统通过三个核心组件工作:Document作为数据载体存储原始文本,Index对文档进行预处理和索引建立高效检索结构,QueryEngine协调检索与生成过程。LlamaIndex支持多种文件格式处理,可自动切分长文本、生成语义向量并建立索引,最终实现基于私有数据的精准问答。该框架显著提升了开发效率,使得构建个性化AI应用(如企业知识库、智能客服等)变得更加简单高效,为开发者提供了
2025-11-14 13:43:16
917
原创 深入掌握 Ollama:Streaming、Thinking、Tool Calling 与 Agent 构建全流程解析
本文全面解析Ollama的七大核心功能,帮助开发者突破基础文本生成的限制。1. Streaming实现实时响应,支持"打字机"效果,适用于聊天机器人等场景。2. Thinking模式展示模型推理过程,增强可解释性,适用于合规审计。3. StructuredOutputs提供JSON格式化输出,便于程序处理结构化数据。4. Vision支持图文混合输入,实现图像识别和场景问答。5. Embeddings生成语义向量,为RAG和相似度计算奠定基础。6. ToolCalling让模型调用外部工具,构建真正智能的A
2025-11-11 12:37:32
1883
原创 vllm参数使用详解
本文详细介绍了vLLM模型服务的多种部署场景,包括基础模型加载(单GPU/多GPU/本地模型)、性能优化(张量并行/CPU Offload)、安全配置(API密钥/访问控制)、LoRA适配器加载、多任务处理(文本分类/语音转录/Embedding)以及多模态模型(图片/音频)等特殊场景。通过具体命令和参数说明,展示了如何在不同需求下高效部署和优化vLLM服务。
2025-11-11 10:35:15
1607
原创 通过vllm快速部署本地大模型
摘要:本文详细介绍了使用vLLM框架在本地部署大模型的完整流程。文章首先对比了vLLM和Ollama两种部署方案,分析其适用场景和技术差异。随后分步骤讲解了环境准备、模型下载、原生部署和Docker部署的具体方法,特别针对Windows/Linux/Mac不同系统提供了详细配置指南。文中重点说明了量化部署、GPU资源优化等关键技术点,并整理了8类常见问题的解决方案,包括显存不足、模型加载失败等实际问题。最后给出了不同硬件条件下的性能优化建议,帮助开发者根据实际需求选择合适的部署方案。
2025-11-10 19:44:22
1446
原创 AI 大模型与 Agent 智能体提示词编写指南
本文系统探讨了AI大模型与Agent智能体的提示词优化策略,主要包含以下内容:1. 核心特性分析:AI大模型基于Transformer架构擅长语言处理,Agent智能体具备自主执行能力;2. 提示词三要素:主题关键词、指令描述、风格约束(AI大模型)和任务目标、必要信息、约束条件(Agent);3. 分场景模板:提供学术文章、代码生成、智能家居控制等场景的结构化提示词示例;4. 模型适配策略:根据参数量(小/中/大/超大型模型)调整提示词复杂度;5. 生产级案例:展示电商客服Agent处理售后咨询的全流程提
2025-11-10 18:25:22
1172
原创 Ollama+Milvus:基于 bge-large 模型的文本嵌入与检索
本文详细介绍了基于Ollama和Milvus向量数据库的文本嵌入与相似性检索完整解决方案。首先讲解了嵌入模型的原理与bge-large模型的优势,然后分步指导环境搭建:安装Ollama运行嵌入模型,部署Milvus向量数据库。核心内容包括:通过Python代码调用bge-large生成1024维文本向量,在Milvus中创建集合存储向量数据,实现基于L2距离的语义相似性检索。文章提供完整的可运行代码示例,涵盖向量生成、数据插入、相似检索全流程,并给出常见问题排查方法。
2025-11-10 17:58:06
1404
原创 Milvus:Rerankers-模型排名器详解(二十五)
本文档详细介绍了Milvus模型排名器的核心功能与应用实践。模型排名器通过引入高级语言模型的语义理解能力,突破了传统向量搜索仅依赖数值匹配的局限,能更精准地识别查询意图。文档涵盖五大模块:核心概念、提供商选择、实施指南、搜索集成和最佳实践,指导开发者完成从环境配置到多场景应用的全流程。Milvus支持vLLM、TEI等多种模型服务提供商,可适配不同业务需求。通过标准向量搜索和混合搜索集成,实现"向量筛选+语义重排"的优化效果。
2025-11-05 20:45:34
829
原创 Milvus:Rerankers-衰减排名器详解(二十四)
本指南详细介绍了Milvus衰减排名器的核心功能、使用方法和最佳实践。衰减排名器突破了传统向量搜索仅依赖相似度的局限,通过结合时间、距离等数值因素优化搜索结果排序。
2025-11-05 20:34:01
647
原创 Milvus:Rerankers-加权、RRF与提升排序器详解(二十三)
摘要:本文详细介绍了Milvus中的三种核心排序器工具及其应用场景。加权排名器通过自定义权重精确控制多路径搜索优先级,适用于电商多模态检索等场景;RRF排序器基于排名位置自动平衡多路径结果,适合跨模态均衡检索;提升排名器则通过元数据规则动态调整单向量搜索排名,满足电商、资讯等业务需求。文章分别阐述了各排序器的工作原理、代码实现、参数配置及性能优化建议,并提供了场景选择指南。三种排序器互为补充,可满足不同业务场景下的向量检索排序需求,通过合理选择和参数调优可显著提升搜索效果与用户体验。
2025-11-05 20:16:30
1068
原创 Milvus:嵌入函数(Embeddings)功能详解(二十二)
摘要:Milvus的嵌入函数模块简化了文本向量化与语义搜索流程,支持OpenAI、AWS Bedrock等主流嵌入服务。通过自动化处理文本转向量、存储和搜索全流程,开发者无需编写底层API代码。该模块支持多服务商配置、批量操作优化和维度定制,适用于文档检索、产品推荐等场景。核心优势包括:开发简化(避免手动处理向量)、统一管理(集中配置多服务商)、灵活适配(支持不同模型和场景)。最佳实践建议采用配置文件管理凭证、按需选择模型类型、实施错误处理和性能优化策略。
2025-11-05 18:15:32
881
原创 Milvus:过滤功能详解(二十一)
文章摘要:本文详细介绍了Milvus数据库的过滤功能,包括基本概念、操作符类型和实际应用场景。过滤功能通过"字段-操作符-值"结构实现精准数据筛选,支持比较、范围、算术、逻辑等多种操作符,并针对特定数据类型(JSON、ARRAY、VARCHAR、GEOMETRY)提供专用操作符。文章还介绍了过滤器模板、随机抽样等高级特性,以及性能优化建议。过滤功能可应用于查询、搜索、删除等操作,能够有效提升数据检索效率,降低资源消耗,适用于推荐系统、地理信息检索等多种业务场景。
2025-11-05 17:11:36
884
原创 Milvus:向量搜索(十八)
Milvus向量数据库提供高效的近似近邻(ANN)搜索功能,支持多种搜索模式:基础搜索:包含单向量和批量向量搜索,支持IP、L2等5种相似度度量类型;高级功能:支持分区搜索、带过滤条件的搜索(标准/迭代两种模式)、范围搜索(半径过滤)以及分组搜索(提升结果多样性);增强功能:包括混合搜索(多向量字段融合)、搜索迭代器(大数据量导出)和全文搜索(关键词匹配);性能优化:通过AUTOINDEX自动优化索引参数,支持分区键加速过滤查询。
2025-11-05 16:46:14
875
原创 Milvus:多向量混合搜索(二十)
混合搜索是一种跨模态搜索技术,融合文本、图像、音频等多种数据类型,实现"输入文本找图片"等场景。它结合了密集向量的语义理解和稀疏向量的精确匹配优势,支持自由组合不同向量类型和自定义权重。主要应用场景包括电商产品搜索、社交媒体检索、企业文档管理和多媒体素材库。技术实现涉及多模态数据准备、多向量集合创建、ANN并行搜索请求和结果融合排序。性能优化包括针对性的索引配置和动态参数调优。该技术通过整合多种数据模态的优势,显著提升了搜索系统准确性和用户体验。
2025-11-05 16:24:43
888
原创 Milvus:查询与文本搜索(十九)
本文详细介绍了Milvus数据库的多种查询功能,涵盖主键查询、分区查询、随机抽样及文本检索等核心功能。基础查询:Get用于主键精确查询,Query支持复杂条件筛选,QueryIterator适用于大数据量分页处理。高级查询:分区查询可提升性能,随机抽样适合数据探索,全文搜索自动计算文本相关性得分。文本检索:包括基于关键词的文本匹配和精确短语匹配,支持逻辑组合和位置容差控制。应用场景:提供了根据不同需求选择查询方式的建议,帮助用户优化查询性能。
2025-11-05 15:50:41
788
Redis Desktop Manager For Mac 2021.10.236(支持M2芯片)
2024-04-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅