寒秋丶-CSDN博客

原创 MCP封装完整指南

这篇文章介绍了MCP（Model Context Protocol）协议及其Python实现。MCP是Anthropic推出的标准化协议，用于AI模型与外部工具的交互，类似USB接口连接设备。文章分为六个部分：首先定义MCP及其核心价值（标准化、解耦、复用、安全）；然后详细讲解MCP三大核心概念：工具（可调用功能）、资源（可读数据）和提示词（交互模板）；接着说明MCP的客户端-服务器架构和工作流程；最后提供Python实现示例，包括环境准备和天气查询服务的代码演示，展示如何创建MCP服务器、定义工具函数和处

2026-05-06 15:47:01 424

原创 Claude Code SDK for Python（旧版本）完全指南

本文介绍了Claude Code SDK的安装与使用方法。主要内容包括：环境准备：要求Python 3.10+和Node.js环境通过npm安装Claude Code CLI工具使用pip安装Python SDK 核心功能与基础用法：支持异步查询和流式响应提供配置对话参数的能力（系统提示、工作目录等）集成常用工具（文件读写、Bash命令等）包含快速入门示例和响应内容解析方法高级功能： ClaudeSDKClient客户端支持双向交互式对话可实现自定义工具（In-Process MCP服务

2026-03-24 11:05:46 662

原创 Claude Code 安装指南

Claude Code 安装与使用指南 Claude Code 是 Anthropic 推出的 AI 编程助手命令行工具，可将 Claude 的强大能力集成到开发环境中。本文档提供了完整的安装和使用说明：系统要求：需 macOS 10.15+/Linux/Windows(WSL2)，Node.js 18+，有效的 Anthropic API Key 安装步骤：注册 Anthropic 账号获取 API Key 安装 Node.js 18+（提供多平台安装方法）通过 npm 全局安装 Claude Co

2026-03-19 17:36:30 800

原创 Claude Code 技能包（Skills）+ MCP + CLAUDE.md 实战详解

Claude Code 是 Anthropic 推出的 AI 开发辅助工具，通过四大核心功能提升开发效率：Skills（预封装工作流）、MCP Servers（外部连接）、CLAUDE.md（项目记忆）和 Plan 模式（规划执行）。本文重点解析 Skills 功能，它包含指令文档、代码脚本和参考资料三大模块，具有零代码创建、灵活应对、多技能联用等优势。Skills 采用渐进式加载机制，按需加载不同层级内容，避免占用过多上下文资源。文章详细介绍了官方 Skills 列表、两种安装方法（命令行和手动安装）以及

2026-03-19 16:30:32 6535

原创 LangChain + DeepSeek 智能体开发（一）

本文档为AI应用开发新手提供基于LangChain生态的全流程实战指南，从基础认知到完整实现一个天气查询智能体。内容涵盖三大核心组件（LangGraph底层框架、LangChain开发框架、DeepAgents套件）的定位与关系，详细讲解环境搭建、代码实现、报错排查等关键步骤。文档包含Python环境配置说明、API密钥申请指南、代码逐行注释及多场景测试案例，并针对常见问题提供解决方案。通过本教程，零基础开发者可快速掌握智能体开发的核心技能，最终实现可自动调用工具的天气查询应用，所有代码均可直接运行调试。文

2026-03-17 23:12:43 697

原创详解Docling与Docling-MCP：文档解析工具与MCP服务全指南

摘要：Docling是一款开源全能型文档解析工具，支持PDF、Office、音频等多元格式，提供高级PDF解析、统一文档表示与多格式导出功能。其衍生工具Docling-MCP基于MCP协议封装标准化服务，支持本地缓存与多协议调用。本文详细介绍了二者的核心功能、本地搭建步骤（Python 3.10+环境配置）及基础使用方法，包括单文档/批量转换、CLI操作等，帮助开发者快速实现非结构化文档的高效解析与AI集成。

2026-03-17 20:40:44 826

原创 Claude Agent SDK 开发指南

Claude Agent SDK 开发指南摘要本文档详细介绍了Anthropic官方Python SDK的使用方法，涵盖从基础到高级的开发实践。主要内容包括： SDK概述：提供与Claude交互的Python工具包，支持查询模式和客户端模式，内置文件操作、命令执行等系统工具。安装配置：支持标准pip安装和开发环境安装，需Python 3.10+，提供环境变量配置说明。核心架构：三层架构设计（Transport层、Query引擎、Message Parser），实现高效通信和消息处理。基础使用：包含简

2026-03-17 18:07:56 1222

原创 Prompt、Agent、Skill、MCP、Claude Code 到底啥区别？

【AI系统架构解析：用"开公司"类比理解核心概念】本文通过"开公司"的类比方式，清晰解析了AI系统的层级架构和核心概念差异。底层LLM是公司的"核心人才"；Prompt如同临时口头指令；Agent则是自主执行任务的"员工"；Skill相当于标准化SOP手册；MCP是连接外部资源的"门禁卡"；Cursor等IDE工具是通用办公场地，而ClaudeCode则是专攻代码的"特种兵"。

2026-03-11 14:15:17 598

原创一文搞懂什么是 Skills？

Claude推出Skills功能模块，通过预置脚本和模板实现任务自动化执行，相比传统方式效率提升40%。Skills与MCP形成互补关系，前者专注任务执行，后者负责系统连接。目前提供12个开源Skills案例，支持自定义开发。这一创新标志着AI应用正从提示词工程转向模块化能力复用，未来企业竞争力将取决于Skill库的丰富度和适用性。

2026-02-09 21:52:59 1316

原创 LangGraph：状态管理与条件路由（二）

本文深入解析LangGraph中的状态管理与复杂流程控制技术。核心内容包括：1）State设计模式，通过不可变状态和增量更新实现可预测的数据流转；2）条件边机制实现基于状态的动态跳转；3）利用异步节点和聚合节点处理并行任务；4）错误处理与重试机制增强系统鲁棒性。最后通过多轮对话订单助手案例，综合展示了槽位填充、状态记忆等功能的实现方法。这些技术共同构成了构建高效、可靠AI工作流的基础框架。

2025-11-18 10:12:09 1433 2

原创 LangGraph：核心概念与简单对话流程（一）

摘要： LangGraph是一个基于大语言模型（LLM）的工作流编排框架，通过图结构组织任务节点和状态流转，支持复杂控制逻辑（如条件分支、循环）。核心组件包括State（共享状态对象）、Nodes（处理单元）和Edges（转移规则），适用于智能客服、数据分析等场景。本文详细介绍了安装步骤、核心概念，并演示了一个对话系统示例：用户输入经意图识别节点（调用DeepSeek模型）路由至对应处理节点，生成响应。LangGraph的图结构设计使其特别适合多轮交互和动态决策应用。

2025-11-18 10:07:53 1737

原创 Pydantic AI：多智能体应用开发（六）

本文介绍了基于PydanticAI的多智能体应用开发指南，主要内容包括：多智能体应用分类：从单智能体到基于图的控制流四个复杂度级别智能体委托开发：通过joke生成示例展示主智能体将任务委托给专业智能体的实现方式程序化智能体交接：以航班预订系统为例，展示应用程序代码控制多个智能体执行顺序的方法复杂系统实现：构建完整的机票预订系统，包含航班搜索、座位选择和订单确认流程最佳实践：强调单一职责、接口清晰、错误处理和资源管理等设计原则文中通过具体代码示例演示了依赖传递、使用量统计、消息历史维护等关键技术点

2025-11-17 16:35:39 1605

原创 Pydantic AI：模型上下文协议 (MCP)（五）

模型上下文协议(MCP)是一种标准化接口协议，支持AI应用程序与外部工具服务的无缝集成。MCP定义了客户端(如PydanticAI代理)与服务器端的标准通信方式，支持stdio、HTTPSSE和可流式HTTP等多种传输协议。PydanticAI既可作为客户端连接各类MCP服务器(如计算服务、天气服务等)，又能作为服务器提供AI能力。协议支持工具调用自定义、命名空间隔离、TLS/SSL安全配置等高级功能，并创新性地实现了采样机制(服务器使用客户端LLM)和信息诱导(结构化输入请求)。MCP显著提升了AI系统的

2025-11-17 16:26:03 1404

原创 Pydantic AI：工具集详解（四）

PydanticAI中的工具集(Toolset)是一种强大的工具管理机制，允许开发者批量管理、组合和动态配置AI代理(Agent)的工具。工具集支持四种注册方式（构建时、运行时、装饰器和上下文覆盖），并提供三种工具添加方法（构造函数、装饰器、动态添加）。通过组合、过滤和重命名工具集，可以实现复杂的功能组合。高级功能包括动态工具定义、执行包装器（如日志记录和缓存）以及多模态支持（如图像处理）。本文以电商客服系统为例，展示了工具集在实际应用中的价值，包括产品查询、订单管理和客户服务等功能的集成。工具集机制使AI

2025-11-17 16:19:14 745

原创 Pydantic AI：函数工具详解（三）

PydanticAI函数工具详解 PydanticAI的函数工具系统为LLM模型提供了强大的现实交互能力，核心价值包括：能力扩展：突破纯文本限制，支持执行具体操作实时数据：获取训练时未知的最新信息确定性操作：结合AI推理与程序逻辑系统集成：连接数据库、API等基础设施工具注册机制：装饰器方式：@agent.tool（需上下文）和@agent.tool_plain（纯函数）构造函数注册：通过Agent的tools参数批量注册支持Pydantic模型定义复杂参数结构高级特性：多模态输出：支持

2025-11-17 15:23:46 1209

原创 Pydantic AI：依赖项系统详解（二）

本文介绍了PydanticAI中的依赖注入系统，该系统采用类型安全的方式为AI代理提供所需的外部服务和数据。主要内容包括：1）依赖项的定义与注入机制，推荐使用数据类组织复杂依赖；2）通过RunContext在系统提示、工具和验证器中访问依赖项；3）同步/异步依赖项的使用场景与实现方式；4）测试时依赖项覆盖的方法；5）SQL生成和多模态应用等实际案例。该系统遵循Python最佳实践，支持类型提示，使应用易于测试、维护和扩展。文章通过丰富代码示例展示了如何构建类型安全、模块化的AI应用，特别适用于使用qwen系

2025-11-17 14:30:36 1030

原创 Pydantic AI ：从安装到智能体开发（一）

PydanticAI是一个由Pydantic团队开发的Python框架，用于快速构建生产级生成式AI应用。该框架支持主流模型（如阿里云Qwen系列），提供类型安全、无缝监控和可靠执行等特性。文章详细介绍了安装配置、基础使用（同步/异步运行）、工具集成、流式输出、多模态处理（图像理解）、配置优化和实际应用案例（如数据分析助手）。PydanticAI通过依赖注入、结构化输出和错误处理等机制，使开发者能够轻松构建复杂AI工作流，特别强调生产环境的可靠性和开发者体验。

2025-11-17 13:55:19 1885

原创 CrewAi多模态AI实战：集成图像、音频分析的智能体系统构建（六）

本文介绍了一个多模态AI智能体系统的设计与实现。该系统能够综合处理文本、图像和音频数据，通过视觉分析工具、音频处理工具和多模态融合工具实现跨模态信息整合。文章详细阐述了技术架构、工具开发、智能体设计以及实战项目案例，包括多媒体内容分析平台的具体实现。系统采用模块化设计，支持实时流处理和性能优化，并提供容器化部署方案。同时探讨了模态对齐、计算资源和数据隐私等技术挑战的解决方案，最后展望了多模态AI在更多模态支持、实时交互和领域专业化等方面的发展方向。该系统为构建更智能、更接近人类感知方式的AI应用提供了实践参

2025-11-14 17:01:01 978 1

原创 CrewAI项目实战：多智能体协作的市场分析平台开发（五）

AutoInsight是一个基于AI智能体的自动化市场洞察报告生成平台，通过多智能体协作实现一键式市场分析服务。系统采用模块化架构设计，包含首席研究员、市场趋势分析员、竞品侦查员、战略顾问和报告合成专家5个智能体角色，分别负责研究框架制定、市场趋势分析、竞争情报收集、SWOT分析和报告整合。技术栈采用FastAPI后端+Streamlit前端，集成通义千问大模型和Serper搜索API，实现从数据收集到报告生成的全流程自动化。项目亮点在于完整的端到端解决方案和专业级报告输出，未来可优化多数据源集成和实时监控

2025-11-14 16:36:49 1213

原创 CrewAI高级流程与架构：构建企业级智能体协作系统（四）

本文系统介绍了CrewAI框架的高级流程控制与性能优化技术。首先分析了顺序流程和分层流程的优缺点，提出使用图式工作流(DAG)实现复杂任务编排，支持条件分支和并行执行。其次，详细阐述了错误处理机制，包括重试策略、熔断器和降级方案。在性能优化方面，提出了智能缓存和LLM调用批处理等方法，显著提升系统吞吐量。最后强调生产级应用需要实现可靠性、性能、可维护性和扩展性的平衡，建议采用渐进式复杂化和监控驱动的优化策略。这些技术使AI智能体能够组成真正高效的协作团队，而不仅是简单任务序列。

2025-11-14 16:32:27 790

原创 CrewAi：工具（Tools）与记忆（Memory）系统（三）

本文系统介绍了如何通过工具（Tools）和记忆（Memory）系统增强AI智能体的实用能力。工具系统赋予智能体与外界交互的能力，包括内置工具（如搜索引擎、计算器）和自定义工具（如股票查询、天气API），可针对不同角色分配专业工具包。记忆系统使智能体能记住对话历史，在多轮交互中保持连贯性，支持智能体级和团队级记忆配置。文章通过智能投资分析团队的完整案例，展示了数据收集员、市场分析师和投资顾问的协同工作流程，配备专业工具链和记忆系统，实现从数据收集到投资建议的端到端分析。最佳实践部分强调了工具错误处理、记忆优化

2025-11-14 16:26:25 1551

原创 CrewAi：Agent、Task、Crew 的详细拆解（二）

本文深入解析了CrewAI框架的三大核心组件配置方法。在Agent配置方面，强调角色定义的明确性、目标设定的可衡量性及背景故事的丰富性，建议根据不同需求选择适合的LLM模型和工具。Task设计需清晰描述任务内容，善用任务依赖关系，并明确预期输出格式。Crew团队组装应根据任务关系选择顺序或分层流程，合理配置团队参数。精细化配置虽然前期投入较大，但能显著提升执行质量、减少迭代成本，建立可复用模板。核心总结：配置精度决定输出质量，精细化的前期设计能够带来长期效益。

2025-11-14 16:22:16 987

原创初识CrewAI：多智能体协作框架指南（一）

【摘要】CrewAI是一个开源的Python框架，专注于多智能体协作任务编排。它通过模拟真实团队分工，将不同角色（如技术专家、文案编辑）分配给特定智能体，按照序列化流程协同完成复杂任务。相比单智能体方案，CrewAI具有角色驱动、流程可配置等优势，支持顺序/并发等协作模式。示例展示了基于阿里云QWEN模型的技术写作团队构建过程，包含智能体角色定义、任务分配和顺序执行流程。该框架适用于需要多领域专业知识协作的应用场景，能有效提升复杂任务的处理效率和质量。

2025-11-14 16:17:56 1133

原创 LlamaIndex：AutoGen智能体与RAG结合（十一）

本文提出一种融合AutoGen、LlamaIndex和Milvus的企业级智能助手架构，通过多智能体协作与检索增强生成技术解决复杂业务问题。系统采用三层设计：Milvus构建向量知识库，LlamaIndex处理文档解析与查询，AutoGen实现任务分解与多Agent协作。文章详细介绍了从环境配置、知识库搭建到智能体系统实现的全流程，包括文档加载、元数据处理、查询封装和权限控制等关键技术。该系统可支持跨部门复杂查询，如同时解答人力资源政策、市场预算和产品案例等问题，并具备动态权限管理和查询日志功能，适用于企业

2025-11-14 14:42:49 849

原创 LlamaIndex：LlamaIndex 与 Milvus 集成（十）

本文介绍了如何将LlamaIndex与Milvus向量数据库结合，构建高性能的企业级RAG系统。主要内容包括：Milvus作为专业向量数据库的特性与优势；通过LlamaIndex实现多模态文档转换和向量嵌入生成；配置LlamaIndex使用Milvus作为底层存储的详细步骤；以及实现高效语义检索和元数据过滤的方法。文章还对比了Milvus与默认存储的性能差异，并提供了索引优化和监控等进阶技巧。这种组合方案既保留了LlamaIndex的智能处理能力，又借助Milvus实现了大规模向量数据的高效存储与检索。

2025-11-14 14:36:39 1023

原创 LlamaIndex：高级RAG技巧解析（九）

本文深入探讨了企业级知识库系统在高阶场景下的四种核心技术。首先介绍了查询路由技术，通过自动判断问题类型选择最佳处理路径，提升系统准确性。其次讲解了子查询与递归检索技术，将复杂问题拆解为小问题并逐层深入检索，解决复合型问题。随后阐述了Agent架构，使AI具备规划、工具调用和反思能力，实现主动决策。最后展示了如何整合这些技术构建智能化问答系统，根据不同问题类型自动选择最佳处理方式。这些方法显著提升了知识库系统处理复杂推理、多源整合和动态决策任务的能力。

2025-11-14 14:33:06 951

原创 LlamaIndex：构建企业级RAG知识库（八）

本文介绍了一个基于LlamaIndex构建的企业级智能知识库助手解决方案。该项目为虚构科技公司SmartAITech设计，支持PDF/Word/PPT/Markdown等多种文档格式加载，通过元数据标注实现部门级权限控制，采用本地LLM(Ollama)和嵌入模型(BGE)确保数据安全。系统具备文档解析、向量索引、多轮对话和Web界面(Gradio)等完整功能模块，从环境配置到最终实现提供了端到端的开发指导，帮助开发者将零散的LlamaIndex功能整合为可用、易用的企业级应用。

2025-11-14 14:29:10 984

原创 LlamaIndex：模块化设计（七）

本文深入讲解如何定制LlamaIndex的RAG系统核心组件，实现完全本地化部署。主要内容包括：1. 解析LlamaIndex模块化设计，介绍ServiceContext的核心协调作用 2. 替换默认LLM为本地Ollama模型，实现安全私有的文本生成 3. 切换嵌入模型为开源BGE系列，支持中英文向量检索 4. 自定义SentenceSplitter文本切分器，提升语义完整性 5. 完整实战示例展示全本地化RAG系统搭建 6. 提供最佳实践方案和常见问题解决方案通过组件替换和参数调优，开发者可构建符合特

2025-11-14 14:21:52 1269

原创 LlamaIndex：深入理解节点后处理与元数据过滤（六）

文章摘要：本文探讨了RAG系统中检索结果不精准的核心问题——语义相关但上下文不匹配。针对这一挑战，提出了两种关键技术：元数据过滤（检索前缩小范围）和节点后处理（检索后优化结果）。文章详细讲解了如何使用部门、年份等元数据进行精确筛选，以及通过重排序、去重、阈值过滤等方法优化检索结果。通过Python代码示例，展示了如何构建高精度问答系统，实现从"语义相似"到"内容精准"的跨越。最后总结了最佳实践和常见误区，为提升企业级问答系统质量提供了实用解决方案。

2025-11-14 14:17:16 938

原创 LlamaIndex：ChatEngine 与复杂查询（五）

摘要：本文深入解析了LlamaIndex中的QueryEngine与ChatEngine核心区别，重点介绍了如何实现智能多轮对话。ChatEngine通过内置记忆模块(Memory)保存对话历史，解决了上下文理解问题，使AI能处理"那今年呢？"等指代性提问。文章详细演示了三种查询变换技术：SimpleQueryTransform规范模糊表达、DecomposeQueryTransform拆分复杂问题、HyDEQueryTransform通过假设答案提升检索效果，并提供了完整代码示例。最佳

2025-11-14 14:11:40 836

原创 LlamaIndex：不止是VectorIndex-选择最适合你数据的索引策略（四）

本文深入探讨了LlamaIndex中三种核心索引类型的特点与应用场景。VectorStoreIndex基于向量相似度检索，适合精确匹配的知识问答；SummaryIndex通过全局摘要实现整体性理解，适合报告总结和趋势分析；TreeIndex采用层次化结构，支持复杂推理和流程解析。文章详细解析了每种索引的工作原理、配置参数和代码实现，并提供了索引选择的实用指南。对于实际应用，作者建议根据数据类型和查询需求灵活组合不同索引，同时提出了数据预处理、参数调优等性能优化策略。掌握这些索引技术能够显著提升AI应用的响应

2025-11-14 14:06:43 1070

原创 LlamaIndex：如何喂数据给LlamaIndex？数据加载器详解（三）

本文系统介绍了大语言模型应用中数据加载的核心技术与实践方法。首先强调"垃圾进，垃圾出"原则，指出数据质量对系统表现的决定性影响。详细解析了LlamaIndex的核心组件SimpleDirectoryReader的功能特点，包括自动格式识别、统一文档转换和元数据处理机制。针对PDF、Word等专业格式文件，阐述了专用解析器的使用技巧和最佳实践。同时介绍了网页内容抓取和数据库数据加载的解决方案，并提供了批量处理和内存优化的策略。最后通过企业级数据整合案例，演示了从多源数据接入到索引构建的完整

2025-11-14 13:58:42 2193

原创 LlamaIndex：深入理解三大核心组件：Document、Index 与 QueryEngine（二）

LlamaIndex数据流程解析：Document、Index与QueryEngine的协作机制本文详细介绍了LlamaIndex框架中的三大核心组件：Document作为基础数据单元，存储文本内容与元数据；Index将非结构化文本转化为可检索的知识结构，支持多种索引类型；QueryEngine作为问答接口，结合检索与生成组件实现智能响应。文章通过代码示例展示了从数据加载、索引构建到问答服务的完整流程，并提供了元数据设计、索引优化等实践建议。该框架通过分层抽象实现了灵活的知识管理能力，为构建企业级智能问答

2025-11-14 13:48:57 998

原创 LlamaIndex：深入理解 LlamaIndex（一）

LlamaIndex是大语言模型与私有数据之间的智能桥梁，它解决了LLM的三大核心痛点：知识局限性、幻觉问题和上下文长度限制。该系统通过三个核心组件工作：Document作为数据载体存储原始文本，Index对文档进行预处理和索引建立高效检索结构，QueryEngine协调检索与生成过程。LlamaIndex支持多种文件格式处理，可自动切分长文本、生成语义向量并建立索引，最终实现基于私有数据的精准问答。该框架显著提升了开发效率，使得构建个性化AI应用（如企业知识库、智能客服等）变得更加简单高效，为开发者提供了

2025-11-14 13:43:16 1321

原创深入掌握 Ollama：Streaming、Thinking、Tool Calling 与 Agent 构建全流程解析

本文全面解析Ollama的七大核心功能，帮助开发者突破基础文本生成的限制。1. Streaming实现实时响应，支持"打字机"效果，适用于聊天机器人等场景。2. Thinking模式展示模型推理过程，增强可解释性，适用于合规审计。3. StructuredOutputs提供JSON格式化输出，便于程序处理结构化数据。4. Vision支持图文混合输入，实现图像识别和场景问答。5. Embeddings生成语义向量，为RAG和相似度计算奠定基础。6. ToolCalling让模型调用外部工具，构建真正智能的A

2025-11-11 12:37:32 2510

原创 vllm参数使用详解

本文详细介绍了vLLM模型服务的多种部署场景，包括基础模型加载（单GPU/多GPU/本地模型）、性能优化（张量并行/CPU Offload）、安全配置（API密钥/访问控制）、LoRA适配器加载、多任务处理（文本分类/语音转录/Embedding）以及多模态模型（图片/音频）等特殊场景。通过具体命令和参数说明，展示了如何在不同需求下高效部署和优化vLLM服务。

2025-11-11 10:35:15 2632

原创通过vllm快速部署本地大模型

摘要：本文详细介绍了使用vLLM框架在本地部署大模型的完整流程。文章首先对比了vLLM和Ollama两种部署方案，分析其适用场景和技术差异。随后分步骤讲解了环境准备、模型下载、原生部署和Docker部署的具体方法，特别针对Windows/Linux/Mac不同系统提供了详细配置指南。文中重点说明了量化部署、GPU资源优化等关键技术点，并整理了8类常见问题的解决方案，包括显存不足、模型加载失败等实际问题。最后给出了不同硬件条件下的性能优化建议，帮助开发者根据实际需求选择合适的部署方案。

2025-11-10 19:44:22 2248

原创 AI 大模型与 Agent 智能体提示词编写指南

本文系统探讨了AI大模型与Agent智能体的提示词优化策略，主要包含以下内容：1. 核心特性分析：AI大模型基于Transformer架构擅长语言处理，Agent智能体具备自主执行能力；2. 提示词三要素：主题关键词、指令描述、风格约束（AI大模型）和任务目标、必要信息、约束条件（Agent）；3. 分场景模板：提供学术文章、代码生成、智能家居控制等场景的结构化提示词示例；4. 模型适配策略：根据参数量（小/中/大/超大型模型）调整提示词复杂度；5. 生产级案例：展示电商客服Agent处理售后咨询的全流程提

2025-11-10 18:25:22 1485

原创 Ollama+Milvus：基于 bge-large 模型的文本嵌入与检索

本文详细介绍了基于Ollama和Milvus向量数据库的文本嵌入与相似性检索完整解决方案。首先讲解了嵌入模型的原理与bge-large模型的优势，然后分步指导环境搭建：安装Ollama运行嵌入模型，部署Milvus向量数据库。核心内容包括：通过Python代码调用bge-large生成1024维文本向量，在Milvus中创建集合存储向量数据，实现基于L2距离的语义相似性检索。文章提供完整的可运行代码示例，涵盖向量生成、数据插入、相似检索全流程，并给出常见问题排查方法。

2025-11-10 17:58:06 1613

原创 Milvus：Rerankers-模型排名器详解（二十五）

本文档详细介绍了Milvus模型排名器的核心功能与应用实践。模型排名器通过引入高级语言模型的语义理解能力，突破了传统向量搜索仅依赖数值匹配的局限，能更精准地识别查询意图。文档涵盖五大模块：核心概念、提供商选择、实施指南、搜索集成和最佳实践，指导开发者完成从环境配置到多场景应用的全流程。Milvus支持vLLM、TEI等多种模型服务提供商，可适配不同业务需求。通过标准向量搜索和混合搜索集成，实现"向量筛选+语义重排"的优化效果。

2025-11-05 20:45:34 990

Redis Desktop Manager For Mac 2021.10.236（支持M2芯片）

python版本selenium webdriver api

空空如也