- 博客(191)
- 资源 (1)
- 收藏
- 关注
原创 MCP封装完整指南
这篇文章介绍了MCP(Model Context Protocol)协议及其Python实现。MCP是Anthropic推出的标准化协议,用于AI模型与外部工具的交互,类似USB接口连接设备。文章分为六个部分:首先定义MCP及其核心价值(标准化、解耦、复用、安全);然后详细讲解MCP三大核心概念:工具(可调用功能)、资源(可读数据)和提示词(交互模板);接着说明MCP的客户端-服务器架构和工作流程;最后提供Python实现示例,包括环境准备和天气查询服务的代码演示,展示如何创建MCP服务器、定义工具函数和处
2026-05-06 15:47:01
305
原创 Claude Code SDK for Python(旧版本) 完全指南
本文介绍了Claude Code SDK的安装与使用方法。主要内容包括: 环境准备: 要求Python 3.10+和Node.js环境 通过npm安装Claude Code CLI工具 使用pip安装Python SDK 核心功能与基础用法: 支持异步查询和流式响应 提供配置对话参数的能力(系统提示、工作目录等) 集成常用工具(文件读写、Bash命令等) 包含快速入门示例和响应内容解析方法 高级功能: ClaudeSDKClient客户端支持双向交互式对话 可实现自定义工具(In-Process MCP服务
2026-03-24 11:05:46
581
原创 Claude Code 安装指南
Claude Code 安装与使用指南 Claude Code 是 Anthropic 推出的 AI 编程助手命令行工具,可将 Claude 的强大能力集成到开发环境中。本文档提供了完整的安装和使用说明: 系统要求:需 macOS 10.15+/Linux/Windows(WSL2),Node.js 18+,有效的 Anthropic API Key 安装步骤: 注册 Anthropic 账号获取 API Key 安装 Node.js 18+(提供多平台安装方法) 通过 npm 全局安装 Claude Co
2026-03-19 17:36:30
733
原创 Claude Code 技能包(Skills)+ MCP + CLAUDE.md 实战详解
Claude Code 是 Anthropic 推出的 AI 开发辅助工具,通过四大核心功能提升开发效率:Skills(预封装工作流)、MCP Servers(外部连接)、CLAUDE.md(项目记忆)和 Plan 模式(规划执行)。本文重点解析 Skills 功能,它包含指令文档、代码脚本和参考资料三大模块,具有零代码创建、灵活应对、多技能联用等优势。Skills 采用渐进式加载机制,按需加载不同层级内容,避免占用过多上下文资源。文章详细介绍了官方 Skills 列表、两种安装方法(命令行和手动安装)以及
2026-03-19 16:30:32
6071
原创 LangChain + DeepSeek 智能体开发(一)
本文档为AI应用开发新手提供基于LangChain生态的全流程实战指南,从基础认知到完整实现一个天气查询智能体。内容涵盖三大核心组件(LangGraph底层框架、LangChain开发框架、DeepAgents套件)的定位与关系,详细讲解环境搭建、代码实现、报错排查等关键步骤。文档包含Python环境配置说明、API密钥申请指南、代码逐行注释及多场景测试案例,并针对常见问题提供解决方案。通过本教程,零基础开发者可快速掌握智能体开发的核心技能,最终实现可自动调用工具的天气查询应用,所有代码均可直接运行调试。文
2026-03-17 23:12:43
630
原创 详解Docling与Docling-MCP:文档解析工具与MCP服务全指南
摘要:Docling是一款开源全能型文档解析工具,支持PDF、Office、音频等多元格式,提供高级PDF解析、统一文档表示与多格式导出功能。其衍生工具Docling-MCP基于MCP协议封装标准化服务,支持本地缓存与多协议调用。本文详细介绍了二者的核心功能、本地搭建步骤(Python 3.10+环境配置)及基础使用方法,包括单文档/批量转换、CLI操作等,帮助开发者快速实现非结构化文档的高效解析与AI集成。
2026-03-17 20:40:44
747
原创 Claude Agent SDK 开发指南
Claude Agent SDK 开发指南摘要 本文档详细介绍了Anthropic官方Python SDK的使用方法,涵盖从基础到高级的开发实践。主要内容包括: SDK概述:提供与Claude交互的Python工具包,支持查询模式和客户端模式,内置文件操作、命令执行等系统工具。 安装配置:支持标准pip安装和开发环境安装,需Python 3.10+,提供环境变量配置说明。 核心架构:三层架构设计(Transport层、Query引擎、Message Parser),实现高效通信和消息处理。 基础使用:包含简
2026-03-17 18:07:56
1063
原创 Prompt、Agent、Skill、MCP、Claude Code 到底啥区别?
【AI系统架构解析:用"开公司"类比理解核心概念】 本文通过"开公司"的类比方式,清晰解析了AI系统的层级架构和核心概念差异。底层LLM是公司的"核心人才";Prompt如同临时口头指令;Agent则是自主执行任务的"员工";Skill相当于标准化SOP手册;MCP是连接外部资源的"门禁卡";Cursor等IDE工具是通用办公场地,而ClaudeCode则是专攻代码的"特种兵"。
2026-03-11 14:15:17
552
原创 一文搞懂什么是 Skills?
Claude推出Skills功能模块,通过预置脚本和模板实现任务自动化执行,相比传统方式效率提升40%。Skills与MCP形成互补关系,前者专注任务执行,后者负责系统连接。目前提供12个开源Skills案例,支持自定义开发。这一创新标志着AI应用正从提示词工程转向模块化能力复用,未来企业竞争力将取决于Skill库的丰富度和适用性。
2026-02-09 21:52:59
1282
原创 LangGraph:状态管理与条件路由(二)
本文深入解析LangGraph中的状态管理与复杂流程控制技术。核心内容包括:1)State设计模式,通过不可变状态和增量更新实现可预测的数据流转;2)条件边机制实现基于状态的动态跳转;3)利用异步节点和聚合节点处理并行任务;4)错误处理与重试机制增强系统鲁棒性。最后通过多轮对话订单助手案例,综合展示了槽位填充、状态记忆等功能的实现方法。这些技术共同构成了构建高效、可靠AI工作流的基础框架。
2025-11-18 10:12:09
1381
2
原创 LangGraph:核心概念与简单对话流程(一)
摘要: LangGraph是一个基于大语言模型(LLM)的工作流编排框架,通过图结构组织任务节点和状态流转,支持复杂控制逻辑(如条件分支、循环)。核心组件包括State(共享状态对象)、Nodes(处理单元)和Edges(转移规则),适用于智能客服、数据分析等场景。本文详细介绍了安装步骤、核心概念,并演示了一个对话系统示例:用户输入经意图识别节点(调用DeepSeek模型)路由至对应处理节点,生成响应。LangGraph的图结构设计使其特别适合多轮交互和动态决策应用。
2025-11-18 10:07:53
1686
原创 Pydantic AI:多智能体应用开发(六)
本文介绍了基于PydanticAI的多智能体应用开发指南,主要内容包括: 多智能体应用分类:从单智能体到基于图的控制流四个复杂度级别 智能体委托开发:通过joke生成示例展示主智能体将任务委托给专业智能体的实现方式 程序化智能体交接:以航班预订系统为例,展示应用程序代码控制多个智能体执行顺序的方法 复杂系统实现:构建完整的机票预订系统,包含航班搜索、座位选择和订单确认流程 最佳实践:强调单一职责、接口清晰、错误处理和资源管理等设计原则 文中通过具体代码示例演示了依赖传递、使用量统计、消息历史维护等关键技术点
2025-11-17 16:35:39
1558
原创 Pydantic AI:模型上下文协议 (MCP)(五)
模型上下文协议(MCP)是一种标准化接口协议,支持AI应用程序与外部工具服务的无缝集成。MCP定义了客户端(如PydanticAI代理)与服务器端的标准通信方式,支持stdio、HTTPSSE和可流式HTTP等多种传输协议。PydanticAI既可作为客户端连接各类MCP服务器(如计算服务、天气服务等),又能作为服务器提供AI能力。协议支持工具调用自定义、命名空间隔离、TLS/SSL安全配置等高级功能,并创新性地实现了采样机制(服务器使用客户端LLM)和信息诱导(结构化输入请求)。MCP显著提升了AI系统的
2025-11-17 16:26:03
1362
原创 Pydantic AI:工具集详解(四)
PydanticAI中的工具集(Toolset)是一种强大的工具管理机制,允许开发者批量管理、组合和动态配置AI代理(Agent)的工具。工具集支持四种注册方式(构建时、运行时、装饰器和上下文覆盖),并提供三种工具添加方法(构造函数、装饰器、动态添加)。通过组合、过滤和重命名工具集,可以实现复杂的功能组合。高级功能包括动态工具定义、执行包装器(如日志记录和缓存)以及多模态支持(如图像处理)。本文以电商客服系统为例,展示了工具集在实际应用中的价值,包括产品查询、订单管理和客户服务等功能的集成。工具集机制使AI
2025-11-17 16:19:14
703
原创 Pydantic AI:函数工具详解(三)
PydanticAI函数工具详解 PydanticAI的函数工具系统为LLM模型提供了强大的现实交互能力,核心价值包括: 能力扩展:突破纯文本限制,支持执行具体操作 实时数据:获取训练时未知的最新信息 确定性操作:结合AI推理与程序逻辑 系统集成:连接数据库、API等基础设施 工具注册机制: 装饰器方式:@agent.tool(需上下文)和@agent.tool_plain(纯函数) 构造函数注册:通过Agent的tools参数批量注册 支持Pydantic模型定义复杂参数结构 高级特性: 多模态输出:支持
2025-11-17 15:23:46
1121
原创 Pydantic AI:依赖项系统详解(二)
本文介绍了PydanticAI中的依赖注入系统,该系统采用类型安全的方式为AI代理提供所需的外部服务和数据。主要内容包括:1)依赖项的定义与注入机制,推荐使用数据类组织复杂依赖;2)通过RunContext在系统提示、工具和验证器中访问依赖项;3)同步/异步依赖项的使用场景与实现方式;4)测试时依赖项覆盖的方法;5)SQL生成和多模态应用等实际案例。该系统遵循Python最佳实践,支持类型提示,使应用易于测试、维护和扩展。文章通过丰富代码示例展示了如何构建类型安全、模块化的AI应用,特别适用于使用qwen系
2025-11-17 14:30:36
1010
原创 Pydantic AI :从安装到智能体开发(一)
PydanticAI是一个由Pydantic团队开发的Python框架,用于快速构建生产级生成式AI应用。该框架支持主流模型(如阿里云Qwen系列),提供类型安全、无缝监控和可靠执行等特性。文章详细介绍了安装配置、基础使用(同步/异步运行)、工具集成、流式输出、多模态处理(图像理解)、配置优化和实际应用案例(如数据分析助手)。PydanticAI通过依赖注入、结构化输出和错误处理等机制,使开发者能够轻松构建复杂AI工作流,特别强调生产环境的可靠性和开发者体验。
2025-11-17 13:55:19
1803
原创 CrewAi多模态AI实战:集成图像、音频分析的智能体系统构建(六)
本文介绍了一个多模态AI智能体系统的设计与实现。该系统能够综合处理文本、图像和音频数据,通过视觉分析工具、音频处理工具和多模态融合工具实现跨模态信息整合。文章详细阐述了技术架构、工具开发、智能体设计以及实战项目案例,包括多媒体内容分析平台的具体实现。系统采用模块化设计,支持实时流处理和性能优化,并提供容器化部署方案。同时探讨了模态对齐、计算资源和数据隐私等技术挑战的解决方案,最后展望了多模态AI在更多模态支持、实时交互和领域专业化等方面的发展方向。该系统为构建更智能、更接近人类感知方式的AI应用提供了实践参
2025-11-14 17:01:01
955
1
原创 CrewAI项目实战:多智能体协作的市场分析平台开发(五)
AutoInsight是一个基于AI智能体的自动化市场洞察报告生成平台,通过多智能体协作实现一键式市场分析服务。系统采用模块化架构设计,包含首席研究员、市场趋势分析员、竞品侦查员、战略顾问和报告合成专家5个智能体角色,分别负责研究框架制定、市场趋势分析、竞争情报收集、SWOT分析和报告整合。技术栈采用FastAPI后端+Streamlit前端,集成通义千问大模型和Serper搜索API,实现从数据收集到报告生成的全流程自动化。项目亮点在于完整的端到端解决方案和专业级报告输出,未来可优化多数据源集成和实时监控
2025-11-14 16:36:49
1184
原创 CrewAI高级流程与架构:构建企业级智能体协作系统(四)
本文系统介绍了CrewAI框架的高级流程控制与性能优化技术。首先分析了顺序流程和分层流程的优缺点,提出使用图式工作流(DAG)实现复杂任务编排,支持条件分支和并行执行。其次,详细阐述了错误处理机制,包括重试策略、熔断器和降级方案。在性能优化方面,提出了智能缓存和LLM调用批处理等方法,显著提升系统吞吐量。最后强调生产级应用需要实现可靠性、性能、可维护性和扩展性的平衡,建议采用渐进式复杂化和监控驱动的优化策略。这些技术使AI智能体能够组成真正高效的协作团队,而不仅是简单任务序列。
2025-11-14 16:32:27
766
原创 CrewAi:工具(Tools)与记忆(Memory)系统(三)
本文系统介绍了如何通过工具(Tools)和记忆(Memory)系统增强AI智能体的实用能力。工具系统赋予智能体与外界交互的能力,包括内置工具(如搜索引擎、计算器)和自定义工具(如股票查询、天气API),可针对不同角色分配专业工具包。记忆系统使智能体能记住对话历史,在多轮交互中保持连贯性,支持智能体级和团队级记忆配置。文章通过智能投资分析团队的完整案例,展示了数据收集员、市场分析师和投资顾问的协同工作流程,配备专业工具链和记忆系统,实现从数据收集到投资建议的端到端分析。最佳实践部分强调了工具错误处理、记忆优化
2025-11-14 16:26:25
1508
原创 CrewAi:Agent、Task、Crew 的详细拆解(二)
本文深入解析了CrewAI框架的三大核心组件配置方法。在Agent配置方面,强调角色定义的明确性、目标设定的可衡量性及背景故事的丰富性,建议根据不同需求选择适合的LLM模型和工具。Task设计需清晰描述任务内容,善用任务依赖关系,并明确预期输出格式。Crew团队组装应根据任务关系选择顺序或分层流程,合理配置团队参数。精细化配置虽然前期投入较大,但能显著提升执行质量、减少迭代成本,建立可复用模板。核心总结:配置精度决定输出质量,精细化的前期设计能够带来长期效益。
2025-11-14 16:22:16
956
原创 初识CrewAI:多智能体协作框架指南(一)
【摘要】CrewAI是一个开源的Python框架,专注于多智能体协作任务编排。它通过模拟真实团队分工,将不同角色(如技术专家、文案编辑)分配给特定智能体,按照序列化流程协同完成复杂任务。相比单智能体方案,CrewAI具有角色驱动、流程可配置等优势,支持顺序/并发等协作模式。示例展示了基于阿里云QWEN模型的技术写作团队构建过程,包含智能体角色定义、任务分配和顺序执行流程。该框架适用于需要多领域专业知识协作的应用场景,能有效提升复杂任务的处理效率和质量。
2025-11-14 16:17:56
1100
原创 LlamaIndex:AutoGen智能体与RAG结合(十一)
本文提出一种融合AutoGen、LlamaIndex和Milvus的企业级智能助手架构,通过多智能体协作与检索增强生成技术解决复杂业务问题。系统采用三层设计:Milvus构建向量知识库,LlamaIndex处理文档解析与查询,AutoGen实现任务分解与多Agent协作。文章详细介绍了从环境配置、知识库搭建到智能体系统实现的全流程,包括文档加载、元数据处理、查询封装和权限控制等关键技术。该系统可支持跨部门复杂查询,如同时解答人力资源政策、市场预算和产品案例等问题,并具备动态权限管理和查询日志功能,适用于企业
2025-11-14 14:42:49
816
原创 LlamaIndex:LlamaIndex 与 Milvus 集成(十)
本文介绍了如何将LlamaIndex与Milvus向量数据库结合,构建高性能的企业级RAG系统。主要内容包括:Milvus作为专业向量数据库的特性与优势;通过LlamaIndex实现多模态文档转换和向量嵌入生成;配置LlamaIndex使用Milvus作为底层存储的详细步骤;以及实现高效语义检索和元数据过滤的方法。文章还对比了Milvus与默认存储的性能差异,并提供了索引优化和监控等进阶技巧。这种组合方案既保留了LlamaIndex的智能处理能力,又借助Milvus实现了大规模向量数据的高效存储与检索。
2025-11-14 14:36:39
959
原创 LlamaIndex:高级RAG技巧解析(九)
本文深入探讨了企业级知识库系统在高阶场景下的四种核心技术。首先介绍了查询路由技术,通过自动判断问题类型选择最佳处理路径,提升系统准确性。其次讲解了子查询与递归检索技术,将复杂问题拆解为小问题并逐层深入检索,解决复合型问题。随后阐述了Agent架构,使AI具备规划、工具调用和反思能力,实现主动决策。最后展示了如何整合这些技术构建智能化问答系统,根据不同问题类型自动选择最佳处理方式。这些方法显著提升了知识库系统处理复杂推理、多源整合和动态决策任务的能力。
2025-11-14 14:33:06
916
原创 LlamaIndex:构建企业级RAG知识库(八)
本文介绍了一个基于LlamaIndex构建的企业级智能知识库助手解决方案。该项目为虚构科技公司SmartAITech设计,支持PDF/Word/PPT/Markdown等多种文档格式加载,通过元数据标注实现部门级权限控制,采用本地LLM(Ollama)和嵌入模型(BGE)确保数据安全。系统具备文档解析、向量索引、多轮对话和Web界面(Gradio)等完整功能模块,从环境配置到最终实现提供了端到端的开发指导,帮助开发者将零散的LlamaIndex功能整合为可用、易用的企业级应用。
2025-11-14 14:29:10
955
原创 LlamaIndex:模块化设计(七)
本文深入讲解如何定制LlamaIndex的RAG系统核心组件,实现完全本地化部署。主要内容包括:1. 解析LlamaIndex模块化设计,介绍ServiceContext的核心协调作用 2. 替换默认LLM为本地Ollama模型,实现安全私有的文本生成 3. 切换嵌入模型为开源BGE系列,支持中英文向量检索 4. 自定义SentenceSplitter文本切分器,提升语义完整性 5. 完整实战示例展示全本地化RAG系统搭建 6. 提供最佳实践方案和常见问题解决方案 通过组件替换和参数调优,开发者可构建符合特
2025-11-14 14:21:52
1246
原创 LlamaIndex:深入理解节点后处理与元数据过滤(六)
文章摘要:本文探讨了RAG系统中检索结果不精准的核心问题——语义相关但上下文不匹配。针对这一挑战,提出了两种关键技术:元数据过滤(检索前缩小范围)和节点后处理(检索后优化结果)。文章详细讲解了如何使用部门、年份等元数据进行精确筛选,以及通过重排序、去重、阈值过滤等方法优化检索结果。通过Python代码示例,展示了如何构建高精度问答系统,实现从"语义相似"到"内容精准"的跨越。最后总结了最佳实践和常见误区,为提升企业级问答系统质量提供了实用解决方案。
2025-11-14 14:17:16
915
原创 LlamaIndex:ChatEngine 与复杂查询(五)
摘要:本文深入解析了LlamaIndex中的QueryEngine与ChatEngine核心区别,重点介绍了如何实现智能多轮对话。ChatEngine通过内置记忆模块(Memory)保存对话历史,解决了上下文理解问题,使AI能处理"那今年呢?"等指代性提问。文章详细演示了三种查询变换技术:SimpleQueryTransform规范模糊表达、DecomposeQueryTransform拆分复杂问题、HyDEQueryTransform通过假设答案提升检索效果,并提供了完整代码示例。最佳
2025-11-14 14:11:40
769
原创 LlamaIndex:不止是VectorIndex-选择最适合你数据的索引策略(四)
本文深入探讨了LlamaIndex中三种核心索引类型的特点与应用场景。VectorStoreIndex基于向量相似度检索,适合精确匹配的知识问答;SummaryIndex通过全局摘要实现整体性理解,适合报告总结和趋势分析;TreeIndex采用层次化结构,支持复杂推理和流程解析。文章详细解析了每种索引的工作原理、配置参数和代码实现,并提供了索引选择的实用指南。对于实际应用,作者建议根据数据类型和查询需求灵活组合不同索引,同时提出了数据预处理、参数调优等性能优化策略。掌握这些索引技术能够显著提升AI应用的响应
2025-11-14 14:06:43
1036
原创 LlamaIndex:如何喂数据给LlamaIndex?数据加载器详解(三)
本文系统介绍了大语言模型应用中数据加载的核心技术与实践方法。首先强调"垃圾进,垃圾出"原则,指出数据质量对系统表现的决定性影响。详细解析了LlamaIndex的核心组件SimpleDirectoryReader的功能特点,包括自动格式识别、统一文档转换和元数据处理机制。针对PDF、Word等专业格式文件,阐述了专用解析器的使用技巧和最佳实践。同时介绍了网页内容抓取和数据库数据加载的解决方案,并提供了批量处理和内存优化的策略。最后通过企业级数据整合案例,演示了从多源数据接入到索引构建的完整
2025-11-14 13:58:42
2149
原创 LlamaIndex:深入理解三大核心组件:Document、Index 与 QueryEngine(二)
LlamaIndex数据流程解析:Document、Index与QueryEngine的协作机制 本文详细介绍了LlamaIndex框架中的三大核心组件:Document作为基础数据单元,存储文本内容与元数据;Index将非结构化文本转化为可检索的知识结构,支持多种索引类型;QueryEngine作为问答接口,结合检索与生成组件实现智能响应。文章通过代码示例展示了从数据加载、索引构建到问答服务的完整流程,并提供了元数据设计、索引优化等实践建议。该框架通过分层抽象实现了灵活的知识管理能力,为构建企业级智能问答
2025-11-14 13:48:57
950
原创 LlamaIndex:深入理解 LlamaIndex(一)
LlamaIndex是大语言模型与私有数据之间的智能桥梁,它解决了LLM的三大核心痛点:知识局限性、幻觉问题和上下文长度限制。该系统通过三个核心组件工作:Document作为数据载体存储原始文本,Index对文档进行预处理和索引建立高效检索结构,QueryEngine协调检索与生成过程。LlamaIndex支持多种文件格式处理,可自动切分长文本、生成语义向量并建立索引,最终实现基于私有数据的精准问答。该框架显著提升了开发效率,使得构建个性化AI应用(如企业知识库、智能客服等)变得更加简单高效,为开发者提供了
2025-11-14 13:43:16
1207
原创 深入掌握 Ollama:Streaming、Thinking、Tool Calling 与 Agent 构建全流程解析
本文全面解析Ollama的七大核心功能,帮助开发者突破基础文本生成的限制。1. Streaming实现实时响应,支持"打字机"效果,适用于聊天机器人等场景。2. Thinking模式展示模型推理过程,增强可解释性,适用于合规审计。3. StructuredOutputs提供JSON格式化输出,便于程序处理结构化数据。4. Vision支持图文混合输入,实现图像识别和场景问答。5. Embeddings生成语义向量,为RAG和相似度计算奠定基础。6. ToolCalling让模型调用外部工具,构建真正智能的A
2025-11-11 12:37:32
2430
原创 vllm参数使用详解
本文详细介绍了vLLM模型服务的多种部署场景,包括基础模型加载(单GPU/多GPU/本地模型)、性能优化(张量并行/CPU Offload)、安全配置(API密钥/访问控制)、LoRA适配器加载、多任务处理(文本分类/语音转录/Embedding)以及多模态模型(图片/音频)等特殊场景。通过具体命令和参数说明,展示了如何在不同需求下高效部署和优化vLLM服务。
2025-11-11 10:35:15
2395
原创 通过vllm快速部署本地大模型
摘要:本文详细介绍了使用vLLM框架在本地部署大模型的完整流程。文章首先对比了vLLM和Ollama两种部署方案,分析其适用场景和技术差异。随后分步骤讲解了环境准备、模型下载、原生部署和Docker部署的具体方法,特别针对Windows/Linux/Mac不同系统提供了详细配置指南。文中重点说明了量化部署、GPU资源优化等关键技术点,并整理了8类常见问题的解决方案,包括显存不足、模型加载失败等实际问题。最后给出了不同硬件条件下的性能优化建议,帮助开发者根据实际需求选择合适的部署方案。
2025-11-10 19:44:22
2161
原创 AI 大模型与 Agent 智能体提示词编写指南
本文系统探讨了AI大模型与Agent智能体的提示词优化策略,主要包含以下内容:1. 核心特性分析:AI大模型基于Transformer架构擅长语言处理,Agent智能体具备自主执行能力;2. 提示词三要素:主题关键词、指令描述、风格约束(AI大模型)和任务目标、必要信息、约束条件(Agent);3. 分场景模板:提供学术文章、代码生成、智能家居控制等场景的结构化提示词示例;4. 模型适配策略:根据参数量(小/中/大/超大型模型)调整提示词复杂度;5. 生产级案例:展示电商客服Agent处理售后咨询的全流程提
2025-11-10 18:25:22
1443
原创 Ollama+Milvus:基于 bge-large 模型的文本嵌入与检索
本文详细介绍了基于Ollama和Milvus向量数据库的文本嵌入与相似性检索完整解决方案。首先讲解了嵌入模型的原理与bge-large模型的优势,然后分步指导环境搭建:安装Ollama运行嵌入模型,部署Milvus向量数据库。核心内容包括:通过Python代码调用bge-large生成1024维文本向量,在Milvus中创建集合存储向量数据,实现基于L2距离的语义相似性检索。文章提供完整的可运行代码示例,涵盖向量生成、数据插入、相似检索全流程,并给出常见问题排查方法。
2025-11-10 17:58:06
1572
原创 Milvus:Rerankers-模型排名器详解(二十五)
本文档详细介绍了Milvus模型排名器的核心功能与应用实践。模型排名器通过引入高级语言模型的语义理解能力,突破了传统向量搜索仅依赖数值匹配的局限,能更精准地识别查询意图。文档涵盖五大模块:核心概念、提供商选择、实施指南、搜索集成和最佳实践,指导开发者完成从环境配置到多场景应用的全流程。Milvus支持vLLM、TEI等多种模型服务提供商,可适配不同业务需求。通过标准向量搜索和混合搜索集成,实现"向量筛选+语义重排"的优化效果。
2025-11-05 20:45:34
932
Redis Desktop Manager For Mac 2021.10.236(支持M2芯片)
2024-04-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅