自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI架构全栈开发实战笔记

记录AI应用开发架构的实战经验与成长。

  • 博客(3549)
  • 收藏
  • 关注

原创 如何设计 Agent Harness 的默认行为与异常处理

Agent Harness直译是“Agent支架/ harness”,是托管Agent全生命周期的运行时容器,类比为宇航员的航天服:宇航员只需要专注于完成太空任务,航天服负责提供氧气、温度调节、防辐射、故障报警等所有环境支撑能力。同理,Agent Harness把Agent业务逻辑和底层运行环境隔离开,开发者只需要编写核心业务逻辑,所有的大模型调用适配、工具调度、状态管理、异常兜底、可观测性都由Harness统一提供。

2026-05-19 02:39:33 70

原创 AI Agent Harness Engineering 时代的产品经理需要具备哪些能力

你不需要成为Prompt工程师,但你要能定义每个Agent的核心Prompt规则:包括系统Prompt的核心要求、Few-Shot示例的标准、输出格式的要求。你不需要写最优化的Prompt,但你要能给Prompt工程师明确的需求:比如要求Agent的回复必须简洁、不能超过50字、必须包含指定的信息。某电商平台要搭建一套多Agent智能客服系统,替代原来的人工客服,目标是降低30%的人工客服成本,同时用户满意度不低于90%,安全合规率100%。

2026-05-19 01:43:14 264

原创 终极指南:AutoGen企业级应用,从原型到生产

AutoGen是微软研究院2023年推出的开源多智能体框架,核心能力是支持多个可定制的Agent自主交互、协作完成复杂任务。和传统单Agent框架(如LangChain)的核心差异是:AutoGen原生支持多角色分工、群组对话、自动任务拆分、工具调用协同,不需要开发者手动编写复杂的任务调度逻辑。企业级AutoGen应用是指:部署在企业内部/面向客户、支撑核心业务流程、满足企业级非功能性需求(安全、合规、可观测、高可用、成本可控)的AutoGen应用,和原型级AutoGen的差异我们会在后续章节详细对比。

2026-05-19 00:46:53 100

原创 端侧AI Agent:智能手机的下一个创新周期

你有没有发现最近几年换手机的动力越来越弱?10年前每年换一次手机,每次新手机都有让人眼前一亮的新功能;5年前两年换一次,无非是拍照更好、屏幕更清晰;现在很多人一台手机用3年以上,新出的手机除了处理器快一点、充电快一点,完全没有非换不可的理由。本文的核心目的就是解答一个行业内外都在关注的问题:智能手机的下一个革命性创新到底是什么?

2026-05-18 23:55:43 85

原创 AI Agent核心技术拆解:从目标拆解到行动执行的全链路

本文从第一性原理出发,完整拆解AI Agent从模糊目标输入到最终行动落地的全链路技术体系:覆盖理论框架、架构设计、核心算法、工程实现、落地实践全流程,既包含面向入门者的概念类比与操作指南,也包含面向资深工程师的性能优化、边界拓展与前沿技术分析。文中附可直接运行的最小Agent实现代码、生产级架构设计方案、多场景落地案例,以及AI Agent行业近70年的发展演化脉络,帮助读者建立从理论认知到落地实践的完整知识体系。

2026-05-18 23:04:34 85

原创 Multi-Agent 工程中最常见的五大死锁场景及解除模式

本文会从场景复现、原理分析、解除模式、代码实现资源互斥等待死锁(和传统OS死锁最相似)任务依赖循环死锁(工作流类多智能体高频出现)同步通信等待死锁(跨节点部署的多智能体高频出现)分布式状态一致性死锁(涉及共享状态修改的多智能体高频出现)目标歧义循环死锁(大模型多智能体独有场景)每种场景都会提供可直接运行的复现代码、一键修复的解除方案,最后会给大家一套可落地的多智能体死锁自动检测与解除架构,开箱即用。

2026-05-18 22:08:26 38

原创 揭秘AI Agent的“思考”链(Chain of Thought)

本文的核心目的是帮你彻底搞懂思维链的本质:它不是什么高大上的黑科技,而是让AI“学会像人一样分步思考”的提示方法。我们会覆盖从CoT的起源、核心原理、不同实现方式,到真实项目中怎么用CoT搭建靠谱的AI Agent,同时也会明确说清楚CoT的能力边界,避免大家神话它、乱用它。本文不会涉及过于复杂的底层模型训练逻辑,所有内容都以“能看懂、能落地”为目标。首先用小学生做数学题的例子引入CoT的核心逻辑拆解3个核心概念和它们之间的关系讲解CoT的算法原理、数学模型和操作步骤。

2026-05-18 21:12:02 180

原创 企业做 Multi-Agent 该先从哪里切?3 个最具 ROI 的突破口

我们首先要明确:企业用的Multi-Agent和你玩的AutoGPT不是一个东西。由多个具备不同专业能力的LLM驱动的智能体组成,按照预设的协作规则,调用企业内部工具、数据、系统,自动完成特定业务流程的分布式系统。可观测:每个Agent的每一步操作、调用的工具、生成的结果都有完整日志可查可管控:可以随时干预Agent的运行,设置权限边界,禁止越权操作可审计:所有操作都留痕,符合企业的数据安全、合规要求可复用:相同的角色、工具、流程可以在不同场景下复用,降低开发成本ROI可测算。

2026-05-18 20:20:53 152

原创 AI Agent Harness与WMS系统集成实践

WMS(仓储管理系统)是负责仓库全生命周期管理的核心系统,核心模块如下:fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none;fill:#333;height:1em;OMS订单系统WMS入口层入库管理模块出库管理模块库存管理模块调度中心模块异常管理模块报表统计模块拣货设备/AGV拣货员PDA核心能力包括:库存查询、波次创建、拣货任务分配、路径规划、异常上报、库存调整等。

2026-05-18 19:24:37 211

原创 为角色扮演 Agent 设计 Harness 人格一致性检查

本文将从核心概念定义出发,带你从零设计并落地一套工业级的角色扮演Agent Harness人格一致性检查体系:我们会先讲解人格一致性的标准化建模方法,再设计三层递进的检查架构,从规则、语义、大模型三个维度实现OOC识别,最后配套动态修正逻辑,把Agent的OOC率控制在5%以内。Harness原本是软件测试领域的概念,指的是包裹在目标系统外围的测试/校验框架,不侵入目标系统的核心逻辑,只对输入输出做拦截校验。

2026-05-18 02:21:37 193

原创 AI Agent Harness Engineering 的上下文窗口限制与优化策略

概念定义核心属性典型值(GPT-3.5系列)模型原生上下文长度Transformer预训练时支持的最大Token序列长度,由注意力机制的物理计算能力决定硬限制,超过直接报错,成本随长度线性上涨有效上下文长度模型能正确感知、引用的上下文中的有效信息长度,受提示词质量、信息密度影响软限制,通常只有原生长度的20%~50%3.2k(16k原生模型)Harness可调度上下文长度Agent控制框架可灵活分配、调度的上下文资源,扣除系统提示词、工具定义、输出格式等固定开销后的剩余窗口。

2026-05-18 01:25:15 282

原创 从 0 到 1 搭建客服 Agent:意图识别、知识检索与对话管理完整实战

概念定义核心目标客服Agent基于大语言模型,具备领域知识、上下文记忆、工具调度能力,能自主完成用户问题解答的智能体最大化用户问题解决率,最小化转人工率意图识别识别用户输入背后的真实需求,比如用户问「什么时候到」对应的意图是「物流查询」准确分类用户需求,为后续处理提供决策依据知识检索(RAG)从私有知识库中检索和用户问题相关的知识片段,喂给大模型生成准确回答解决大模型幻觉问题,确保回答符合企业的官方规则对话管理。

2026-05-18 00:23:52 289

原创 为什么你的 Agent Debug 成本比开发更高:可观测性缺失带来的灾难

随着大模型技术的成熟,Agent已经成为了大模型落地的核心载体:从客服Agent、数据分析Agent、到研发效能Agent、自动化办公Agent,几乎所有的企业都在尝试搭建自己的Agent体系。但整个行业的注意力都集中在Agent开发框架(LangChain、AutoGPT、MetaGPT)、性能优化(Prompt工程、RAG、微调)上,却完全忽略了Agent生命周期中最重要的环节:可观测性。和传统的确定性应用不同,Agent的执行逻辑是非确定性、事件驱动、状态分布式存储。

2026-05-17 23:27:44 58

原创 基于 Skip Graph 的 Harness 分布式服务发现

本文将以全球知名分布式CI/CD平台Harness的生产实践为案例,从零到一讲解基于Skip Graph的去中心化服务发现方案的设计、实现与落地全流程。我们会从Skip Graph的基础原理讲起,分析Harness放弃Consul自研服务发现的业务背景,拆解整个架构的核心模块、核心流程,结合生产级Go代码示例讲解如何实现服务注册、发现、分布式健康检查,最后分享Harness在生产环境落地的效果与最佳实践。import ("sync""time"// Node Skip Graph节点的核心结构体。

2026-05-17 22:36:29 60

原创 Harness层加密传输:Agent通信安全

本文将带你从零到一、从原理到实践,深入拆解Harness云原生CI/CD平台中Agent与Manager之间的分层加密传输机制。安全理论基础模块:先带你梳理零信任架构下云原生CI/CD通信的核心安全要求,然后介绍Harness采用的TLS 1.3单向加密、mTLS双向身份验证、自定义HMAC-SHA256消息签名、AES-256-GCM数据加密(可选分层)等核心加密技术的原理与数学模型;Harness架构与通信流程模块:接着我们会拆解Harness SaaS/自托管平台的完整架构,重点看。

2026-05-17 21:40:11 170

原创 为什么你的 AI Agent Harness Engineering 总是失控:可观测性与安全边界设计深度解析

本文将从真实失控案例的根因拆解入手,系统性讲解AI Agent Harness层的核心定位、可观测性体系的全链路设计、五层安全边界的落地方法,配合完整的Python实战代码、架构设计图、最佳实践,帮你从零搭建一套符合企业级合规要求的Agent管控体系。2022年之前AI Agent还停留在实验室阶段,大家的注意力都放在怎么让Agent会用工具、会做规划,完全没有管控的概念。

2026-05-17 19:52:46 293

原创 RAG vs Agent 什么时候检索足够 什么时候必须执行闭环

常见问题解答:用RAG实现,回答物流时效、退款政策、活动规则等问题订单查询:用Agent实现,调用订单系统查询订单状态、物流信息售后处理:用Agent实现,帮用户申请退款、修改地址、退换货。

2026-05-17 19:02:39 312

原创 面向游戏AI Agent的Harness帧同步管理

概念定义核心属性帧同步(Lockstep)游戏同步技术的一种,所有客户端/服务端只同步玩家输入,每帧基于相同的初始状态+相同的输入序列,计算出完全一致的游戏状态,核心是输入确定性一致性强、带宽占用低、100%可复现游戏AI Agent指能够自主感知游戏状态、输出决策动作的智能体,包括规则AI、强化学习(RL)训练的AI、大模型驱动的生成式AI三类,通常部署在云端集群而非游戏客户端决策时延波动大、分布式部署、需要可观测、可调试Harness帧同步管理。

2026-05-17 02:08:48 208

原创 LangGraph 节点间数据传递的四种模式:参数、上下文、状态与缓存

路由Agent:识别用户问题类型,传递参数给对应的下游Agent审核Agent:查询售后政策(缓存),结合用户等级(上下文)、订单信息(状态)给出审核结果退货Agent:处理退货申请,更新订单状态(状态)退款Agent:处理退款申请,更新订单状态(状态)

2026-05-17 01:07:27 128

原创 用 Agent 构建智能会议助手的技术方案

相信很多职场人都有过类似的痛苦:开2小时会,花3小时整理纪要,动作项记漏了没人跟进,会上讨论过的问题过两周又要重新讨论,共享的PPT和资料散落在各个群里找不到。传统的会议工具只能完成录屏、语音转文字的基础功能,无法主动理解会议内容、关联上下文、执行会后动作。本文的目的就是给出一套可直接落地的技术方案,基于Agent技术构建智能会议助手,覆盖会前准备、会中辅助、会后跟进全流程。方案适用于企业内部例会、面试、线上发布会、远程培训等所有会议场景,支持对接飞书、腾讯会议、钉钉等主流办公工具。

2026-05-17 00:06:02 360

原创 AI Agent Harness版本管理:迭代与回滚策略

术语定义AI Agent的编排运行框架,负责整合Prompt、大模型、工具集、RAG知识库、编排逻辑、评估模块等核心组件,是Agent的运行时载体复合版本区别于传统软件的单一语义化版本,AI Agent Harness的版本是多个独立组件版本的集合,每个组件可以独立迭代、独立回滚影子迭代新版本和旧版本并行运行,生产流量复制一份给新版本处理,但结果不对外输出,仅做指标对比,无业务风险的迭代方式细粒度回滚。

2026-05-16 23:09:46 119

原创 深度解析:Function Calling 的进化史与 Agent 工具调用的未来

术语定义LLM原生具备的、自主判断是否需要调用外部能力、生成符合规范的调用参数、并整合返回结果的能力工具调用比FC更宽泛的概念,所有LLM调用外部能力的行为都属于工具调用,包括原生FC、Prompt模拟调用、代码解释器执行等工具编排多个工具按特定逻辑顺序/并行执行的调度能力,是复杂Agent任务的核心支撑工具Schema描述工具功能、参数、返回值的元数据,是LLM理解工具使用方法的核心依据Agent执行回路。

2026-05-16 22:08:36 260

原创 从0到1构建企业级Multi-Agent系统:架构设计与实施路线图

大模型驱动的Agent是指能自主感知环境、做出决策、执行动作、迭代优化的智能实体组件作用实现方式感知模块接收用户输入、环境反馈、工具返回结果自然语言理解、多模态识别记忆模块存储历史交互信息、业务知识、操作记录短期记忆(Redis)、长期记忆(向量库)规划模块拆解任务、制定执行步骤、选择合适工具思维链(CoT)、反思机制行动模块调用工具、输出结果、和其他Agent交互工具调用API、消息通信协议ActiontfPerceptiontMem。

2026-05-16 21:12:08 294

原创 如何评估引入AI Agent的ROI(投资回报率)

随着大模型驱动的AI Agent技术进入规模化落地期,全球87%的中大型企业已将AI Agent纳入2024-2026年的技术投资 roadmap,但仅12%的企业能准确量化AI Agent的投入产出比,62%的企业因盲目投资导致AI项目ROI低于预期甚至亏损。

2026-05-16 20:10:44 325

原创 如何处理 AI Agent Harness Engineering 的幻觉问题

Harness的原意是「马具、安全带」,在AI Agent领域特指Agent的执行控制骨架任务接收与歧义澄清任务拆解与路径规划工具选择与参数生成执行状态管理与流转工具结果整合与判断任务终止条件判断与结果输出Harness Engineering就是专门研究如何构建高可靠、高可控、低幻觉的Agent控制层的工程领域,是Agent落地生产的核心技术支柱。Harness层做出的执行决策不符合预设的业务规则、工具规范、任务约束,和实际的执行环境、任务目标不匹配的现象。幻觉类型发生层级。

2026-05-16 19:09:23 335

原创 开源vs商业:AI Agent平台选型指南

很多人对AI Agent平台的认知还停留在"Agent开发框架"的层面,这是最大的误解。我们选型的时候选的不是一个写代码的库,而是支撑Agent从开发、调试、部署、监控到迭代全生命周期的一整套工具集。AI Agent平台是指能够提供LLM适配、工具调用、记忆管理、多Agent编排、RAG集成、运维监控、安全合规全链路能力的PaaS层产品,目标是降低AI Agent的开发门槛,提升落地效率。区别于单纯的Agent框架,平台必须覆盖全生命周期,而不是只解决开发环节的问题。

2026-05-16 02:06:20 273

原创 传统软件公司如何转型AI Agent服务商

AI Agent被公认为下一代软件的核心载体,正在重构整个软件产业的价值分配逻辑:传统流程驱动的软件将逐步被目标驱动的智能Agent替代,软件厂商的商业模式也将从一次性License/订阅收费转向按效用分成的增值模式。对于积累了深厚行业Know-how、客户资源和落地服务能力的传统软件公司(ISV)而言,这是一次跳过SaaS阶段直接升级到新一代软件范式的历史性机遇,同时也面临着技术栈重构、组织能力升级、商业模式迭代的多重挑战。

2026-05-16 00:51:52 319

原创 Harness 中的动态重试预算分配

术语定义重试预算单个任务在整个生命周期内被允许的最大重试次数静态重试预先固定配置每个任务的重试次数,不随外部环境变化动态重试根据实时系统状态、任务属性动态调整每个任务的可重试次数重试预算池某一维度(团队、项目、优先级)下所有任务可使用的重试总额度优先级权重不同重要程度的任务分配预算时的权重系数,优先级越高权重越大失败类型识别判断任务失败的原因是可重试的偶发故障(网络波动、第三方服务过载)还是不可重试的确定性故障(代码错误、配置错误)熔断阈值。

2026-05-12 21:32:14 304

原创 超级个体工具包:10 个 AI Agent Harness Engineering 提升个人工作效率的实战场景

为了避免你对「AI Agent Harness Engineering」产生误解,我们必须明确它的边界与外延。

2026-05-12 20:31:45 204

原创 AI Agent Harness Engineering 的红队测试:从攻击面到测试用例

2024年以来,全球已经发生超过300起AI Agent被攻击的安全事件:某电商客服Agent被prompt注入后自动给攻击者退款数十万元、某企业内部Agent被记忆投毒后泄露核心研发数据、某政务Agent被劫持工具调用后批量查询公民隐私信息。这些事件中,90%的漏洞不是来自LLM本身的幻觉,而是来自Agent Harness层的逻辑缺陷。

2026-05-12 19:29:04 195

原创 AI Agent Harness Engineering 技术栈选型:前端、后端、AI模型的完整组合

Harness原意指马具,引申为承载、管控实体运行的基座框架。AI Agent Harness是支撑一个或多个AI Agent全生命周期运行的完整系统,向上承接用户交互,向下管控Agent的推理、工具调用、多Agent协作,同时提供监控、观测、权限、成本管控等通用能力,它和Agent本身的关系就像Tomcat和Web应用的关系:Agent是具体的业务逻辑,Harness是让所有Agent稳定运行的基础设施。

2026-05-12 02:28:31 401

原创 AI Agent Harness Engineering 产品化避坑指南:技术团队必须理解的六大原则

随着2024年AI Agent从概念走向落地,国内超过70%的To B、To C科技公司都在布局Agent相关业务,但根据信通院2024年发布的《AI Agent落地白皮书》,已经上线的Agent项目中,错误率超过20%的占比高达83%,因为安全问题下线的占比达到41%,投入产出比不达预期的占比更是超过90%。

2026-05-12 01:40:02 377

原创 AI Agent Harness Engineering 个人效率工具:日程管理、任务拆解与目标追踪

本文将带你基于AI Agent Harness Engineering(AI代理编排工程),从零搭建一个完全属于你自己的个人效率中枢,整合「目标追踪-智能任务拆解-自动日程管理」三个核心模块,全程提供可直接运行的代码,不需要复杂的运维部署,你可以根据自己的工作习惯任意定制功能,再也不用被SaaS工具的付费墙、功能限制绑架。

2026-05-12 00:46:12 349

原创 LangGraph 性能优化:减少图遍历过程中的状态复制开销

本文将带你深入 LangGraph 的内部机制,聚焦于"状态复制"这一核心话题。我们将从理解 LangGraph 的状态管理基本原理开始,剖析为什么状态复制会发生,它是如何影响性能的。然后,我们将循序渐进地介绍多种实用的优化策略,从简单的代码调整到更深层次的架构设计。我们不仅会讨论"做什么",更会解释"为什么这么做"。通过具体的代码示例、性能基准测试对比,以及对源码层面的探讨,你将获得一套完整的工具集来诊断和解决你的 LangGraph 应用中的性能问题。

2026-05-11 23:57:42 133

原创 构建具备情感智能的AI Agent

普通AI Agent:具备感知、决策、行动闭环能力的智能体,核心目标是完成用户下达的明确任务,比如订机票、查天气、写文案等,决策逻辑完全围绕任务效率优化。情感智能(Emotional Intelligence, EI):由心理学家丹尼尔·戈尔曼提出,指个体感知、理解、表达、调节自身与他人情感的能力,核心是共情能力。二者结合就是具备情感智能的AI Agent。

2026-05-11 23:09:12 157

原创 从 0 到 1 搭建研究型 Agent:检索、批判阅读与引用管理

我猜很多做科研的朋友都有过这样的噩梦:要写一篇领域综述,熬了3天翻遍了知网、arxiv、PubMed、IEEE Xplore十几个数据库,下载了200多篇文献,光是去重、分类就花了一整天;读了一周才看了一半,看到最后已经忘了前面的文献讲了什么,不同文献的结论互相矛盾也发现不了;写完论文调引用格式调了3遍,提交的时候还是被导师骂有20多处引用错误,要么格式不对要么出处标错。

2026-05-11 22:08:42 75

原创 Multi-Agent + RPA = 企业自动化 2.0

而近几年快速发展的Multi-Agent(多智能体)技术,刚好补上了传统RPA的短板:Multi-Agent系统有自主感知、决策、协同能力,能理解自然语言、处理非结构化数据、应对异常场景、跨流程协同,但缺乏直接操作企业系统的执行能力。两者结合刚好是“大脑+双手”的黄金组合:Multi-Agent负责理解业务目标、做决策、处理异常、协同流程,RPA负责执行具体的系统操作,这就是我们今天要讲的企业自动化2.0。

2026-05-11 21:14:48 341

原创 混沌工程与Agent Harness:故意引入故障以增强韧性

混沌工程是在受控的实验环境中,主动向系统注入真实可能发生的故障,观察系统的行为表现,从而发现系统脆弱点、提升系统韧性的一套方法论。混沌工程的核心逻辑不是「搞破坏」,而是「提前排雷」:就像疫苗一样,主动注入少量灭活病毒,让身体产生抗体,避免未来感染更严重的疾病。对比维度混沌工程传统测试手动故障注入核心目标发现未知的脆弱点验证已知的功能正确性验证特定故障下的表现故障设计基于真实生产故障,覆盖长尾场景基于需求文档,覆盖已知场景基于经验,随机选择场景执行方式。

2026-05-11 20:20:59 342

原创 AI Agent的抗干扰能力:复杂环境下的决策稳定性设计

AI Agent的抗干扰能力是指Agent在存在未知输入扰动、恶意攻击、环境突变、内部组件故障等非理想条件下,仍能保持决策逻辑一致、输出符合预设目标的能力,是鲁棒性、可靠性、容错性三类能力的综合体现。概念核心定义核心目标适用场景核心评估指标典型技术手段鲁棒性模型/系统在输入存在微小扰动时输出保持稳定的能力对抗输入层的微小扰动图像识别、语音识别对抗样本准确率、噪声鲁棒性对抗训练、数据增强、正则化可靠性系统在规定时间和条件下完成规定功能的能力保障长期稳定运行工业系统、金融系统。

2026-05-11 19:32:29 328

原创 AI Agent Harness Engineering 在网络安全攻防中的角色

本文的核心目的是帮读者搞懂三个问题:什么是AI Agent Harness Engineering?它为什么是网络安全攻防场景下AI落地的必备基础设施?我们怎么在自己的安全团队里落地AHE?本文覆盖的范围包括AHE的核心概念、架构设计、核心算法、项目实战、落地场景、最佳实践等全链路内容,不涉及过于晦涩的底层大模型训练细节,所有知识点都可以直接落地到实际安全工作中。

2026-05-11 02:31:58 396

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除