AI软件工程实践-CSDN博客

原创 Agent 协作中的“领导者”模式：Hierarchical Teams 架构解析

Leader：项目经理Agent（使用GPT-4o）：负责接收用户需求、拆解任务、分配给技术经理和测试经理、最终验收交付；Manager1：技术经理Agent（使用GPT-4 Turbo）：负责拆解技术任务、分配给前后端工程师、校验代码质量、管控开发进度；Manager2：测试经理Agent（使用Claude 3 Sonnet）：负责拆解测试任务、分配给测试工程师、校验测试结果、输出测试报告；Worker1：前端工程师Agent。

2026-06-23 22:50:23 81

原创 AutoGen实战：微软的多Agent对话编程指南

自从2022年ChatGPT发布以来，大语言模型（LLM）已经成为了AI应用的核心基础设施，但很多开发者在做复杂LLM应用的时候都会遇到同一个痛点：单Agent能力有限，要做一份完整的行业研报、一个复杂的项目方案、一套自动化的办公流程，单靠一个AI根本搞不定，你得手动拆分任务、切换不同角色的Prompt、处理上下文传递、调用各种工具，整个过程又繁又杂，代码写了几千行，最后效果还不稳定。

2026-06-23 21:48:45 99

原创多智能体强化学习协作：在模拟环境中训练协作与竞争策略

多个具有自主决策能力的智能体组成的系统，智能体之间可以通过通信、交互来完成共同的目标或者竞争资源，每个智能体的决策会影响其他智能体的环境。纯协作场景：simple_spread_v3：有N个智能体和N个地标，智能体需要移动到对应的地标上，覆盖所有地标，不能碰撞其他智能体，所有智能体的奖励完全相同：覆盖的地标越多奖励越高，碰撞其他智能体会扣奖励。纯竞争场景：simple_adversary_v3。

2026-06-23 20:57:42 151

原创智能体部署的合规性检查清单：等保、个保法、行业法规的对应要求

本文整理了覆盖**等保2.0（1-4级）、《个人信息保护法》、《生成式人工智能服务管理暂行办法》**以及金融、医疗、政务、教育、汽车5个重点行业专属法规的合规检查清单，总共12大类187个可直接落地的检查项，同时提供了自动化合规检查工具、量化评估模型和全流程检查方法，帮助大家在智能体的需求、开发、测试、上线、运营全生命周期落地合规，避免踩坑。概念名称定义智能体部署合规性。

2026-06-23 19:56:14 182

原创基于意图识别的 AI Agent Harness Engineering 任务分发机制

意图识别（Intent Recognition, IR）：从用户输入的自然语言（包括多轮上下文）中识别用户的真实需求类别，并提取出完成任务需要的关键信息（槽位）的过程。比如用户输入“我订单号12345的衣服破了要退款”，意图识别会输出：意图=申请退款，槽位={订单号:12345, 退款原因:商品破损}。

2026-06-23 02:58:26 133

原创从Prompt到Harness：AI开发范式的三次跃迁

2022年底ChatGPT的问世，彻底重构了AI应用的开发逻辑：从过去「预训练+微调+部署」的高门槛范式，变成了普通人写几句提示词就能做应用的低门槛模式。但短短两年时间，AI开发已经经历了三次核心范式跃迁：从最初的Prompt Engineering（提示词工程），到中期的Orchestration（编排/Agent），再到当前正在爆发的Harness（AI应用全生命周期治理）。这三次跃迁不是替代关系，而是逐层演进的关系，背后是AI开发从「玩具级Demo」到「工业化生产」的必然路径。

2026-06-23 02:07:25 147

原创 LangGraph工作流的版本管理与回滚：应对提示词与流程变更的挑战

在正式讨论版本管理与回滚之前，我们先快速回顾一下LangGraph的核心定义——毕竟如果读者对LangGraph不熟悉，后面的内容就是空中楼阁。根据LangChain官方文档的定义，LangGraph是一个用于构建状态ful、有条件分支、循环、多Agent协作的大语言模型（LLM）应用的库。

2026-06-23 01:06:09 213

原创 Agent可信度建设：从可解释性到可审计性的系统化方法论

概念定义核心价值Agent可信度Agent的决策和行为符合预期、可被理解、可被追溯、符合合规要求的程度是Agent规模化落地的前提可解释性（X-Agent）向使用者、监管方清晰说明Agent决策的逻辑、依据、不确定性的能力消除决策黑盒，提升用户信任，辅助问题定位可审计性（Audit-Agent）对Agent全生命周期的操作、决策、交互进行记录、追溯、校验、合规判定的能力满足合规要求，实现责任划分，防范系统性风险。

2026-06-23 00:09:56 143

原创 Prompt Engineering在Agent场景的高阶应用技法

恭喜你，不是的！Prompt Engineering在Agent场景下，远不止“写个好指令”这么简单——它是一套包含“认知架构适配、指令分层设计、环境感知机制、记忆管理策略、多Agent协作约束、工具调用安全控制、反馈迭代闭环”的完整方法论体系。这套方法论体系，我们可以称之为**“Agent-Oriented Prompt Engineering（AOPE）”——或者更通俗一点，“高阶Agent提示工程”**。我们将首先建立。

2026-06-22 20:24:36 9

原创 Agent 的计划可执行性检查器：约束表达与静态验证思路

在广义的Agent架构（比如BDI模型：Belief-Desire-Intention，信念-愿望-意图）里，计划（Plan）是Agent为了实现某个“愿望（Desire）”转化成的“意图（Intention）”，所采取的有限、有序的动作序列，每个动作都有“前置条件（Precondition）”“执行效果（Effect）”和“动作成本（Cost，可选）”。"Slope_5": {"max_weight": 20.0, "location": ["Inbound_Belt_3", "A区电梯间"]},

2026-06-22 19:33:31 90

原创多智能体系统的容错边界：当 30% Agent 离线时，系统如何降级运行？

什么是「多智能体系统」？简单来说，MAS是由多个自主决策、相互协作、环境感知的计算实体（Agent）组成的分布式系统。这些Agent不需要中央控制（或者只有弱中央协调），就能通过消息传递、资源竞争、任务分解等方式完成单个Agent无法完成的复杂任务——比如刚才提到的双11全链路调度，或者自动驾驶的车路协同、机器人足球赛、电力系统的需求侧响应。什么是「容错边界」？容错边界（Fault Tolerance Boundary）是指MAS在满足核心性能指标约束（比如SLA、准确率、延迟）的前提下，能够承受的。

2026-06-22 14:44:37 67

原创实战：使用 LangGraph 构建循环工作流 Harness

术语定义类比LangGraph基于LangChain生态的状态化图工作流框架，原生支持循环、条件分支、状态持久化工作流的"操作系统"，负责调度所有步骤的执行和状态流转循环工作流包含一个或多个可重复执行的步骤，直到满足终止条件才结束的工作流做饭时炒菜→尝味道→加调料→再炒菜的循环，直到味道合适出锅Harness本文中特指可复用的循环工作流封装框架，内置监控、错误处理、中断恢复、配置化能力工作流的"脚手架"，不用每次从零搭地基，直接在上面建业务逻辑State（状态）

2026-06-22 13:56:07 98

原创 AI Agent Harness Engineering 在会议场景中的智能助理实践

你是否有过这样的经历：每周花10小时以上在各种会议上，一半时间在讨论重复的问题，会后花2小时整理纪要，派出去的行动项半个月后还没落地？Gartner 2023年调研显示，全球企业每年在无效会议上的损失超过2万亿美元，国内72%的职场人认为会议占用了超过30%的工作时间，仅60%的会议决议能得到有效落地。传统会议助理仅能实现语音转写、基础纪要生成等被动功能，无法适配会议场景多模态数据处理、跨工具协同、动态决策辅助等复杂需求。

2026-06-22 12:55:38 151

原创 LangChain 已老，LangGraph 当立？新一代编排框架的底层逻辑

组件集成：统一封装LLM调用、工具调用、向量检索、数据库操作等通用能力，降低开发者的集成成本流程控制：定义任务的执行顺序、分支逻辑、循环条件，让LLM可以按照业务规则完成复杂任务状态管理：维护任务执行过程中的上下文、中间结果、用户交互信息，保证流程的连续性可观测性：记录每一步的执行日志、LLM调用参数、耗时、token消耗，方便调试和排查问题容错能力：处理LLM调用失败、工具超时、状态异常等问题，保证系统的稳定性TtotalTllmTorchestrat。

2026-06-22 12:01:47 128

原创 Harness Engineering：智能体任务动态优先级

为满足工业级系统的合规性与可调试性要求，ATDP的多维权重向量必须具备领域可解释性、可量化调整性、权重正交性时间紧迫性（Time Urgency,TUTUTU：任务在绝对或相对时间窗口内未完成的“惩罚价值损失”，单位为价值当量（Value Equivalent, VE）/延迟时间单位（通常为秒，sss资源消耗成本（Resource Consumption Cost,RCCRCCRCC：任务执行过程中消耗的所有可量化资源的“机会价值损失总和”，单位为VE。

2026-06-22 03:01:17 185

原创降低Agent响应延迟的十项工程优化：从网络层到模型推理的全链路提速

让你的Agent应用“飞起来”，同时避免过度优化（比如为了快牺牲准确性90%以上）和“无效优化”（比如只优化模型推理却忽略了占比70%的向量数据库检索）。本文的范围聚焦在通用大模型Agent的全链路工程优化延迟根源定位的方法论和工具（先学会“看病”再“开药”）从用户输入到Agent输出的四个核心环节的十项优化每项优化的适用场景、原理、代码、效果、注意事项从“玩具级Agent”到“生产级Agent”的全链路最佳实践未来3-5年Agent延迟优化的发展趋势本文不包含大模型的预训练优化。

2026-06-22 01:59:51 139

原创低代码开发 AI Agent Harness Engineering：Coze_Dify 平台的高级玩法与局限性

AI Agent（人工智能代理）是指能够感知环境、做出决策并执行动作的智能系统。与传统的单次调用大模型不同，AI Agent 具备记忆能力工具使用能力和规划能力。AgentLLMMemoryToolsPlanningAgentLLMMemoryToolsPlanning: 作为 Agent 的“大脑”，负责理解、推理和生成内容。Memory (记忆)

2026-06-22 01:03:37 250

原创五分钟彻底搞懂AI Agent的核心本质

AI Agent就是具备自主完成目标能力的智能实体，你可以把它理解为一个AI版的打工人：你只需要给它下达一个明确的目标，它会自己感知环境、调取知识、规划步骤、调用工具、执行操作，遇到问题自己调整优化，直到最终交付你要的结果，中间不需要你一步步发指令。官方的学术定义是：AI Agent是指能够感知环境、自主决策、执行动作，并通过与环境的持续交互实现特定目标的人工智能系统，核心特征是「自主性、适应性、社交性、主动性」。

2026-06-22 00:02:46 115

原创为辩论 Agent 设计 Harness 反驳检测与回合制控制

本节将建立辩论Agent、Harness系统、反驳检测、回合制控制的精确术语体系，避免因语义歧义导致的技术偏差。随着GPT-4o、Claude 3.5 Opus、Gemini Ultra等多模态大语言模型的涌现，LLM在单一任务（如文本生成、代码编写、知识问答）上的表现已接近或超过人类平均水平，但在多轮对抗性交互（如辩论赛、法庭辩护、商务谈判）这类需要深度逻辑推理、事实核查能力、共情理解能力、实时战略决策的复杂任务上仍存在明显缺陷：为解决上述问题，本文提出为辩论Agent设计专门的Harness系统——Ha

2026-06-21 23:00:54 89

原创 AI Agent Harness数据同步：多端一致性

你有没有遇到过这种情况？早上出门用手机上的AI助理说「今晚8点提醒我给妈妈打电话过生日」，到公司打开电脑上的同一个AI助理查待办，却完全看不到这条提醒，晚上加班忙忘了，回家被妈妈吐槽了半小时？这就是AI Agent多端不一致的典型场景。本文的核心目的就是讲解AI Agent架构中的Harness层如何解决多端数据一致性问题，涵盖原理、算法、实战、最佳实践全流程，我们不会涉及Agent底层的推理逻辑、prompt工程，只聚焦于「Agent跨端数据同步」这一个垂直领域。

2026-06-21 21:59:31 183

原创 Harness 中的工具调用预测与预取

本文将带你一步步学习如何在一个 React 项目中，使用强大的Chart.js库以及它的官方 React 绑定库来创建漂亮的交互式图表。我们不会一开始就讲复杂的混合图表或性能优化，而是从最基础的准备工作开始，到安装依赖，再到创建第一个静态柱状图，然后逐步升级到动态数据绑定自定义与美化添加交互性，最后会简要提及一些进阶话题（比如混合图表、性能优化、通用组件封装），帮你打开数据可视化的大门。

2026-06-21 20:58:09 175

原创 Multi-Agent 工作流编排指南：如何设计高效的任务分配与结果聚合机制

随着大模型技术的普及，单Agent的能力边界已经无法满足复杂场景的需求：长文本写作、产品研发、多领域咨询等任务往往需要多个不同专业能力的智能体协作完成。但当前绝大多数Multi-Agent应用都面临任务分配混乱、结果冲突、流程不可控、效率低下等痛点，甚至很多场景下多个Agent协作的效果还不如单个优化好的Agent。

2026-06-21 19:51:34 208

原创从0到1构建Multi-Agent决策支持系统：LangGraph实战指南

术语通俗解释专业定义Agent企业里的员工，有自己的角色、技能、工具、记忆，能独立完成特定任务具备感知能力、推理能力、行动能力、记忆能力的智能实体，能自主完成给定目标Multi-Agent系统企业的团队，多个不同角色的Agent按照一定规则协作，完成单个Agent无法完成的复杂任务由多个自主Agent组成的分布式系统，Agent之间通过通信、协作、协商共同完成全局目标决策支持系统(DSS)辅助企业管理者做决策的工具，把数据、模型、界面整合在一起，提升决策质量和效率。

2026-06-21 02:48:39 132

原创用 FUSE 文件系统实现 Harness 的持久化队列

我们这套方案已经开源，项目名称为，目前已经在10+企业的Harness生产集群落地，稳定运行超过1年，零数据丢失事故。项目地址：https://github.com/CloudNativeTech/harness-fuse-queue零侵入：完全兼容POSIX接口，Harness无需修改任何代码即可使用高可靠：WAL+同步刷盘，数据丢失概率低于1e-12高性能：单节点吞吐量12000QPS，延迟低于1ms，比传统MQ方案性能提升300%低运维：无需额外运维中间件集群，运维成本降低70%

2026-06-21 01:57:29 167

原创 AI Agent Harness Engineering 自动化部署实战：一键完成Agent的上线与更新

传统的DevOps主要关注“代码”的全生命周期管理，传统的MLOps主要关注“模型”的全生命周期管理，但AI Agent不仅包含“代码”和“模型”，还包含“Prompt工程”、“Toolkit”、“Memory”、“Planning”等多个独特的组成部分——因此，传统的DevOps和MLOps都无法完全满足AI Agent的全生命周期管理需求，这就催生了Harness AgentOps。而GitOps的出现，彻底改变了这种局面——它使得基础设施和应用的部署运维变得“可追溯、可审核、可回滚、自动化”。

2026-06-21 00:56:06 194

原创 LangGraph 性能优化：减少图遍历过程中的状态复制开销

最近半年我对接了12家做企业级Agent应用的客户，有8家都遇到了同一个问题：用LangGraph开发的Agent测试的时候跑得好好的，一上线到100并发，服务器32G内存直接被打满，接口延迟从几十毫秒飙升到几秒，甚至直接OOM崩溃。排查下来发现，90%的内存开销都来自LangGraph图遍历过程中的状态复制。本文的核心目的就是彻底解决这个痛点：在不修改LangGraph核心执行逻辑、不破坏不可变状态的可回溯、并发安全特性的前提下，将状态复制的开销降低一个数量级以上。

2026-06-20 23:54:43 93

原创如何将 Agent 嵌入 Web 产品成为原生能力

本文将带你从零开始，系统学习如何将 Agent 深度嵌入 Web 产品，使其成为产品的原生能力，而不是一个简单的附加功能。首先理解什么是 Agent，以及它与传统 Chatbot 的区别探讨 Agent 嵌入 Web 产品的不同架构模式手把手实现一个具有原生 Agent 能力的任务管理应用深入探讨如何设计自然、无缝的用户体验分析性能优化、安全性等关键问题展望这一领域的未来发展趋势在人工智能领域，Agent（智能体）是指能够感知环境、做出决策并采取行动的自主实体。

2026-06-20 22:53:24 64

原创 AI Agent Harness Engineering 的前世今生：从专家系统到自主智能体

AI Agent Harness是一套独立的智能体管控层，位于业务应用、Agent实例、外部环境（工具、知识库、其他Agent）之间，为所有Agent提供统一的状态管理、工具调度、安全审计、可观测性、容错熔断、多Agent协同、资源配额管控等通用能力。我们可以用云原生的Sidecar模式来类比：Harness就是Agent的Sidecar，把和业务无关的管控逻辑抽离到独立的进程/服务里，和Agent实例通过标准接口通信，不需要每个Agent都重复实现管控逻辑。

2026-06-20 21:05:59 141

原创政务场景下AI Agent Harness Engineering 的安全合规与落地实践

2023年以来，全国已有超过30个省份上线了政务大模型应用，涵盖智能客服、审批秒办、政策解读、风险预警等多个场景，AI Agent作为大模型的“执行载体”，能够自主跨系统调用数据、编排业务流程、完成复杂任务，大幅提升了政务服务效率：例如某长三角城市上线的AI政务办事Agent，将大学生就业补贴申领的办理时长从3个工作日压缩到10秒以内，办事群众跑动次数从3次降到0次，政务人员的人工审核工作量减少了92%。

2026-06-20 20:04:34 95

原创 AI Agent Harness Engineering 入门实战：搭建你的第一个Agent管控运行环境

本文是一篇AI Agent Harness Engineering的入门实战指南，我们不会讲太多抽象的理论，而是会手把手带你搭建一套完整的、可运行的Agent管控运行环境第一部分（核心概念）：我们会先明确几个关键的概念——什么是Agent？什么是Harness？什么是Agent Harness Engineering？我们会用类比的方式（比如把Agent比作“工厂里的工人”，把Harness比作“工厂的管理系统”）让你快速理解这些概念；第二部分（技术选型）

2026-06-20 19:13:25 100

原创 Multi-Agent 在 SaaS 产品中的商业机会：从收费模型到续费驱动力

多角色协作任务。

2026-06-20 02:21:17 192

原创记忆共享策略对比：全共享、分组共享、按任务共享的利弊与适用场景

本文中的记忆LLM训练/微调场景：模型参数、梯度、嵌入表、训练中间特征联邦学习场景：全局模型参数、中间梯度、特征嵌入多智能体场景：经验池、工具调用记录、知识图谱条目、历史交互数据记忆共享就是多个参与方（训练节点、联邦参与方、智能体）之间按照一定的规则读写公共/他人记忆，实现知识复用、提升整体效率和效果的机制。所有参与方共用同一份完整的全局记忆，所有参与方的更新都会同步到全局记忆，所有读操作都从全局记忆拉取，没有任何隔离机制。

2026-06-20 01:24:42 168

原创基于 HyperLogLog 的 Harness 独立访客估算

想象一下，你是一家快速增长的 SaaS 公司的数据工程师。你们的产品正在被全球各地的用户使用，而你的团队需要精确了解每天有多少独立用户访问你们的平台。最初，这个任务似乎很简单：只需将每个用户的 ID 存储在数据库中，然后执行查询即可。但随着公司的发展，问题开始显现。你的用户基数从几千增长到几百万，再到几千万。suddenly，那个简单的查询开始需要几分钟，然后是几小时，最后甚至无法在合理时间内完成。数据库服务器的负载飙升，存储成本呈指数级增长，而你的团队却还在为实时获取准确的独立访客数据而苦苦挣扎。

2026-06-20 00:23:02 233

原创基于最小堆的 Harness 延迟任务调度器

二叉堆（Binary Heap）是一种完全二叉树完全二叉树条件：除了最后一层外，其他每一层的节点数都是满的，最后一层的节点都靠左排列；堆序性条件（Heap Order Property）二叉最小堆（Binary Min-Heap）：每个节点的值都小于等于其子节点的值（根节点的值是整个堆中最小的）；二叉最大堆（Binary Max-Heap）：每个节点的值都大于等于其子节点的值（根节点的值是整个堆中最大的）。在延迟任务调度器中，我们需要快速找到到期时间最早的任务，因此我们选择二叉最小堆。

2026-06-19 23:26:46 80

原创智能家居的新大脑：AI Agent Harness Engineering 控制中心

AHE是专门面向智能家居场景设计的AI智能体编排适配框架，它的核心定位是家庭全场景智能的"中央大脑"：通过统一适配层接入所有品牌、所有协议的智能家居设备，聚合用户行为、环境、健康、日程等全维度上下文数据，调度多个垂直领域的AI智能体自主协商决策，生成符合用户个性化需求的控制策略，最终实现全场景的主动智能服务。驾驭设备：打破品牌壁垒，统一管控所有智能家居设备驾驭智能体：协调多个不同目标的AI智能体，避免决策冲突驾驭数据：安全合规地使用家庭多源数据，在保护隐私的前提下释放数据价值。

2026-06-19 22:30:31 89

原创 Multi-Agent 在金融行业应用：风控、审计与自动化投研案例拆解

要理解Multi-Agent系统，我们首先需要明确什么是Agent（智能体）。一个能够感知环境、做出决策并采取行动以实现特定目标的实体。自主性（Autonomy）：Agent能够在没有人类或其他实体直接干预的情况下运行，并且能够控制自己的行为和内部状态。感知能力（Sensory Capability）：Agent能够通过传感器感知周围环境的状态变化。在软件系统中，这可能表现为接收数据、读取文件、监听API等。行动能力（Actuation Capability）：Agent能够通过执行器对环境产生影响。

2026-06-19 21:29:10 113

原创 Multi-Agent协作中的冲突消解：基于优先级的消息队列设计

为了解决上述资源冲突、任务抢占、信息不一致、通信拥堵、动态优先级调整、死锁活锁避免的多Agent协作核心痛点，本文将提出一套**「基于业务语义的多维动态优先级评分 + 多级分类阻塞式消息队列 + 乐观锁定+悲观补偿的混合冲突消解机制」**的完整设计方案。灵活性：优先级不再是静态的数字，而是由Agent身份、业务指标、任务紧急度、时间衰减因子、系统负载等多维业务语义参数加权计算出来的，支持运行时动态调整；可扩展性：消息队列采用多级分类阻塞架构。

2026-06-19 20:32:54 142

原创技术深度：智能体规划算法（Planning）原理拆解

基于上述关键术语，我们可以将经典确定性规划问题（Classical Planning Problem）PclassicalSATs0GPclassicalSATs0GSSS是一个有限的离散状态集合；AAA是一个有限的离散动作集合；TS×A→STS×A→S是一个确定性状态转换函数；s0∈Ss_0 \in Ss0∈S是初始状态；G⊆SG⊆S是目标状态集合。寻找一条可行计划πa0a1an−1。

2026-06-19 19:36:37 370

原创 AI Agent Harness Engineering 的“手”不够用？解析 MCP 协议如何统一工具调用标准

今天，我们要聊的就是Anthropic在2024年10月发布的——一个专门为大模型Agent设计的、统一的工具调用与上下文共享协议，它就像Agent工具生态的「USB-C」：不管你用的是LangChain、AutoGen、自研Harness，还是OpenAI的GPT-4o、Anthropic的Claude 3.5 Sonnet、Meta的Llama 3.1 400B，只要双方都支持MCP，Agent就能一次性“解锁”所有MCP兼容的工具。

2026-06-19 02:44:01 214

原创多智能体强化学习：如何让 Agent 在交互中自我进化？

MPE是一个简单的2D物理环境，包含多个粒子（智能体），它们可以在环境中移动、观察其他粒子、与其他粒子交互。简单（simple）：一个智能体，需要移动到一个固定的目标位置。简单传播（simple spread）：多个智能体和多个地标，每个智能体需要覆盖一个地标，同时避免碰撞。简单参考（simple reference）：两个智能体，一个是说话者，一个是听者。说话者需要告诉听者移动到哪个地标。简单协作（simple cooperative）：两个智能体和一个地标，它们需要协作将一个大的粒子推到地标位置。

2026-06-19 01:42:32 169

空空如也

空空如也