- 博客(191)
- 收藏
- 关注
原创 Agent 记忆系统完整实现(四):短期记忆:最近发生的事!
短期记忆(Short-Term Memory, STM) 是 Agent 记忆系统中负责存储最近发生事件的临时存储层。它类似于人类大脑中的工作记忆,能够在短时间内保持和处理有限数量的信息。
2026-03-20 10:32:12
501
1
原创 Agent 记忆系统完整实现(第 3 篇):工作记忆与上下文管理!
工作记忆(Working Memory)是认知心理学中的一个核心概念,指的是个体在进行复杂认知任务时,用于暂时存储和处理信息的有限容量系统。将这一概念引入到 AI Agent 的设计中,**工作记忆**特指 Agent 在当前会话周期内,用于维护和处理与当前任务相关的临时信息的机制。
2026-03-20 10:29:33
479
1
原创 Agent 记忆系统完整实现(二):记忆系统架构全景——分层设计与核心模块!
本文将深入剖析 Agent 记忆系统的整体架构,从分层设计、记忆分类、生命周期到核心模块实现,为读者呈现一幅完整的记忆系统技术全景图。
2026-03-19 10:50:33
509
1
原创 破局与重构:为什么 Agent 需要记忆系统?
2023 年,ChatGPT 的爆火让全世界看到了大语言模型(LLM)的惊人能力。然而,随着 Agent 技术的快速发展,一个根本性的问题逐渐浮出水面:Agent 没有记忆。
2026-03-19 10:41:34
1023
原创 MCP 协议深度解析(八):Prompts 提示模板与 Sampling 采样机制!
本文是《MCP 协议深度解析》系列的第 8 篇,深入探讨 MCP 协议中 Prompts 提示模板系统与 Sampling 采样机制的设计原理、实现细节与最佳实践。通过双语言代码示例(TypeScript + Python),帮助开发者掌握 MCP 的高级交互能力。
2026-03-18 11:28:37
528
原创 MCP 协议深度解析(七):Resources 资源系统——URI、订阅与内容管理
本文是《MCP 协议深度解析》系列的第 7 篇,聚焦 MCP 协议中至关重要的 **Resources(资源)** 系统。Resources 为 AI 模型提供了访问外部数据源的标准化方式,是 MCP 四大核心原语之一。本文将从设计理念到实战实现,全面解析资源系统的每个技术细节。
2026-03-18 11:26:00
503
1
原创 MCP 协议深度解析(六):Tools 工具系统:注册、发现与调用!
本文是《MCP 协议深度解析》系列的第 6 篇,聚焦 MCP 协议中最核心的概念——Tools 工具系统。从前几篇的基础概念到本文的实战细节,带你彻底掌握 MCP 工具的设计哲学与实现原理。
2026-03-17 16:05:59
529
1
原创 MCP 协议深度解析(五):HTTP/SSE 传输层深度实现——远程服务通信!
本文是《MCP 协议深度解析》系列的第五篇,聚焦于 MCP 协议的 HTTP/SSE 传输层实现。我们将深入探讨远程服务通信的完整技术栈,从基础原理到生产级部署,帮助开发者构建高可用、高性能的 MCP 远程服务。
2026-03-17 15:43:33
469
原创 MCP 协议深度解析(四):stdio 传输层深度实现——本地工具通信
本系列文章深入剖析 Model Context Protocol (MCP) 协议的各个层面,从基础概念到高级实现,帮助开发者全面掌握 MCP 协议的设计思想与技术细节。本文是系列第四篇,聚焦 stdio 传输层的深度实现。
2026-03-16 10:12:24
592
1
原创 MCP 协议规范详解(下):进阶机制与扩展!
在前两篇文章中,我们深入探讨了 MCP(Model Context Protocol)协议的基础架构、核心概念和基本通信流程。然而,一个成熟的生产级协议远不止是简单的请求-响应模型。在实际应用中,我们需要面对各种复杂的场景。
2026-03-16 10:10:45
414
1
原创 MCP 协议规范详解(上):消息格式与生命周期
在上一篇文章《MCP 协议深度解析(一):架构设计与核心概念》中,我们介绍了 Model Context Protocol(MCP)的整体架构和设计理念。作为连接 AI 模型与外部世界的桥梁,MCP 协议的重要性不言而喻。然而,仅仅理解架构层面的设计是远远不够的——要真正掌握 MCP,深入理解其协议规范是必不可少的。
2026-03-15 15:35:11
626
原创 MCP 协议深度解析(一):MCP 协议概览与架构设计
在 AI 应用蓬勃发展的今天,大型语言模型(LLM)的能力边界正在不断扩展。然而,模型本身的知识是静态的、有限的,要让 AI 真正具备**与外部世界交互**的能力,就必须引入**工具调用(Tool Calling)**机制。
2026-03-15 15:33:31
452
原创 【生产级 RAG 系统】实战案例:完整 RAG 系统从 0 到 1——端到端项目实现与部署!
本系列最后一篇,将前面 7 篇文章的知识融会贯通,带你从零构建一个完整的生产级 RAG 系统,包含架构设计、代码实现、Docker/Kubernetes 部署、监控告警和性能测试。
2026-03-14 11:37:14
41
1
原创 【生产级 RAG 系统】生产优化:缓存、预计算、流式更新——打造高性能高可用的 RAG 系统
生产级 RAG 系统不仅需要功能完善,更需要高性能、高可用、低成本。本文深入讲解查询缓存、索引预计算、流式更新、性能监控、成本控制、高可用设计等关键技术,助你打造企业级 RAG 系统。
2026-03-14 11:33:15
100
原创 【生产级 RAG 系统】混合检索:稀疏 + 密集 + 学习排序——融合多种检索策略的终极方案!
在生产级 RAG 系统中,单一检索策略往往难以满足复杂场景的召回需求。混合检索通过融合稀疏检索(BM25/TF-IDF)和密集检索(向量相似度),结合学习排序(LTR)技术,实现优势互补,显著提升检索质量。本文将深入讲解混合检索的架构设计、算法原理和实战实现。
2026-03-14 11:17:16
56
原创 【生产级 RAG 系统】重排序:Cross-Encoder、LLM Rerank——提升检索质量的精排技术!
在 RAG 系统中,粗排(向量检索)负责快速召回候选文档,而精排(重排序)则决定了最终进入 LLM 上下文的文档质量。本文深入讲解 Cross-Encoder、LLM Rerank 等重排序技术,帮助你构建高质量的生产级 RAG 系统。
2026-03-14 11:15:16
48
原创 【生产级 RAG 系统】多路召回:向量 + 关键词 + 图检索——融合多种检索策略实现全面召回!
在 RAG 系统中,单一检索方式难以覆盖所有查询场景。多路召回通过融合向量检索、关键词检索和图检索等多种策略,实现互补优势,显著提升召回率和准确性。本文将深入讲解多路召回架构设计与实战实现。
2026-03-14 11:11:05
130
原创 【生产级 RAG 系统】向量检索:HNSW、IVF、量化技术——高性能近似最近邻搜索实战!
向量检索是 RAG 系统的性能核心。本章深入讲解 HNSW、IVF 等主流索引算法,乘积量化与标量量化技术,相似度度量方法,以及 Milvus 生产环境实战配置,助你构建毫秒级响应的向量检索服务。
2026-03-14 11:05:49
36
原创 【生产级 RAG 系统】文档处理:解析、分块、向量化策略——构建高质量知识库的第一步!
文档处理是 RAG 系统的基础。本章将深入讲解 PDF/Office 解析、智能分块策略、Embedding 模型选型与优化,帮你构建高质量的知识库。
2026-03-14 11:03:28
57
原创 【生产级 RAG 系统】开篇:RAG 架构演进与核心挑战——从基础检索到生产级系统的跃迁之路!
检索增强生成(RAG)是构建企业级 AI 应用的核心技术。本系列将带你从基础原理到生产实践,深入讲解多路召回、混合检索、重排序等关键技术,打造高性能、高可用的生产级 RAG 系统。
2026-03-14 10:24:58
246
原创 【多 Agent 协作系统】实战案例:完整项目从设计到部署——多 Agent 协作系统端到端实现指南!
理论终须实践。本章将通过一个完整的电商客服系统案例,带你从需求分析、架构设计、编码实现到部署运维,全面掌握多 Agent 协作系统的实战技能。
2026-03-13 16:49:08
135
1
原创 【多 Agent 协作系统】安全与隔离:权限控制、沙箱、审计日志——构建安全可信的多 Agent 系统!
安全是多 Agent 系统的底线。本章将深入讲解身份认证、权限控制、沙箱隔离、审计日志、数据加密,以及安全最佳实践。
2026-03-13 16:47:09
133
原创 【多 Agent 协作系统】性能优化:负载均衡、缓存策略、资源调度——打造高性能多 Agent 系统!
性能是多 Agent 系统成功的关键。本章将深入讲解负载均衡策略、缓存优化、资源调度算法、连接池管理,以及性能监控与调优实战。性能是多 Agent 系统成功的关键。本章将深入讲解负载均衡策略、缓存优化、资源调度算法、连接池管理,以及性能监控与调优实战。
2026-03-13 16:43:16
208
原创 【多 Agent 协作系统】冲突解决:协商机制、投票系统、优先级策略——构建和谐的多 Agent 协作环境!
Agent 系统中冲突不可避免。本章将深入讲解冲突检测、协商机制、投票系统、优先级策略、仲裁机制,以及冲突解决的实战实现。
2026-03-13 16:41:13
87
原创 【多 Agent 协作系统】状态管理:共享记忆、分布式状态、一致性——构建可靠的多 Agent 状态系统!
状态管理是多 Agent 系统的核心挑战。本章将深入讲解共享记忆架构、分布式状态同步、一致性协议、状态持久化策略,以及状态管理的实战实现。
2026-03-13 16:34:47
310
原创 【多 Agent 协作系统】任务编排:工作流引擎、依赖管理、并行执行——让多 Agent 高效协同完成任务
复杂任务需要多个 Agent 协同完成。本章将深入讲解任务拆解、DAG 工作流引擎、依赖管理、并行执行策略,以及任务编排的实战实现。
2026-03-13 16:32:14
244
原创 【多 Agent 协作系统】通信协议:消息格式、服务发现、RPC 调用——构建高效可靠的 Agent 通信网络
通信是多 Agent 协作的基础。本章将深入讲解消息格式设计、服务发现机制、RPC 调用模式、异步通信协议,以及通信层的容错与优化策略。
2026-03-13 16:26:21
262
原创 【多 Agent 协作系统】架构模式:中心化 vs 去中心化 vs 混合——三种架构的深度对比与选型指南!
择合适的架构模式是多 Agent 系统成功的关键。本章将深入剖析中心化、去中心化和混合三种架构模式,通过实战案例、性能对比和决策树,帮助你做出正确的架构选型。
2026-03-13 16:24:08
333
原创 【多 Agent 协作系统】核心概念:Agent/Session/Skill 与通信机制——构建多智能体系统的四大基石!
理解 Agent、Session、Skill 和通信机制是设计多 Agent 协作系统的基础。本章将深入剖析这四大核心概念,带你从理论到实践,掌握多 Agent 系统的架构设计精髓。
2026-03-13 16:22:09
286
原创 【多 Agent 协作系统】开篇:为什么需要多 Agent 协作——从单智能体局限性到 Swarm 架构演进!
当单个 AI 助手遇到复杂任务时,如何像人类团队一样分工协作?本系列将带你深入多 Agent 协作系统的架构设计,从理论基础到生产实战,一步步构建你的 AI 智能体集群。
2026-03-13 16:14:14
528
原创 【Agent 架构设计】记忆系统深度解析:从 RAG 到 Hindsight 的演进之路!
AI Agent 记忆系统是 2026 年最热门的技术方向之一。本文从 RAG 的局限性出发,深度解析新一代记忆系统 Hindsight 的架构设计,包括 biomimetic 数据结构、三阶段记忆处理(Retain/Recall/Reflect)、以及生产级部署方案。附完整代码示例和性能对比数据。
2026-03-12 21:34:51
448
1
原创 【端侧 AI 实战】BitNet 详解:1-bit LLM 推理优化从原理到部署!
微软 BitNet 框架今日 GitHub Trending 榜首(31,246 ⭐,单日 +2,149),标志着 1-bit LLM 正式进入生产阶段。本文深度解析 1.58-bit 量化原理、bitnet.cpp 内核优化技术,并提供完整的 CPU/GPU 部署指南。实测 M2 MacBook 运行 8B 模型速度提升 5.14 倍,能耗降低 70%。
2026-03-12 21:33:48
1750
原创 2026 年最强 AI Agent 框架 OpenClaw 深度评测:让智能体真正「记住」一切!
ClawHub 是 OpenClaw 的技能市场,类似 npm 包管理器,但专为 AI 智能体设计。AI Agent 正在从"玩具"走向"工具"。通过本地化部署、记忆系统增强、子智能体编排等特性,OpenClaw 让智能体真正成为你的数字助手,而不是偶尔聊天的玩具。2026 年,善用 AI 的开发者,正在悄悄拉开与同龄人的差距。你,准备好加入这场变革了吗?📌 互动话题你在 AI Agent 开发中遇到过哪些痛点?OpenClaw 能解决吗?欢迎在评论区留言讨论!🔗 参考资料。
2026-03-11 23:15:52
490
1
原创 Openclaw切换回话遗忘问题!受够了 AI 的金鱼记忆!我花 2 小时给 OpenClaw 装上永久记忆系统!
事情是这样的 —— 每次我和 OpenClaw 聊天,它都像金鱼一样,会话一结束就什么都忘了。- 昨天说好的偏好设置,今天得重新说- 配置过的东西,下次还要重新解释- 任务做到一半,下次得从头交代
2026-03-11 10:04:57
851
原创 安全警示|“小龙虾“OpenClaw 被爆多个高中危漏洞,开发者需立即修复!
【安全周报 2026 年 3 月 10 日讯】** 近日,广受欢迎的开源 AI 助手框架 OpenClaw(代号"小龙虾"🦞)被安全研究人员发现存在多个高危和中危安全漏洞,可能影响数百万开发者的工作区安全。
2026-03-10 21:50:02
473
1
原创 10-Claude-Code高级应用与最佳实践
本章将深入探讨 Claude Code 的高级用法、性能优化策略、安全最佳实践、团队协作技巧以及实战项目案例,帮助你成为一名高效的 AI 辅助开发者。
2026-03-10 11:07:16
459
原创 09-Claude-Code集成与扩展
Claude Code 作为一款强大的 AI 编程助手,其真正的威力在于与其他开发工具和工作流的无缝集成。本章将深入探讨如何将 Claude Code 融入你的开发生态系统,从 IDE 到 CI/CD,再到自定义扩展开发。
2026-03-10 11:06:27
744
原创 08-Claude-Code调试与错误处理
本章节详细介绍 Claude Code 的调试技巧、错误分析方法、日志解读、性能优化策略以及常见问题的解决方案。
2026-03-09 14:03:58
597
2
原创 07-Claude-Code代码生成实战
本章将深入探讨如何利用 Claude Code 进行高效的代码生成、重构和测试,通过实战案例帮助您掌握 AI 辅助编程的核心技巧。
2026-03-09 14:03:11
411
dvwa-penetration-testing.zip
2026-02-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅