自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

AI架构全栈开发实战笔记

记录AI应用开发架构的实战经验与成长。

  • 博客(3427)
  • 收藏
  • 关注

原创 面向多租户 Agent 的 Harness 可观测性租户标签

随着AIOps(智能运维)、RPA(机器人流程自动化)、大语言模型 Agent(LLM Agent)编排平台的快速普及,多租户 Agent 集群已成为企业级 SaaS 平台的标配。以 Harness 为例——作为业界领先的 CI/CD、Feature Flags、Cloud Cost Management(CCM)与AIOps/LLM Agent 统一编排平台。

2026-04-19 02:07:53 53

原创 智能体编排艺术:使用 LangGraph 构建复杂的有向循环图(DAG)

首先,我们需要定义状态结构。decision: str # 新增字段,用于存储决策loop_count: int # 循环次数max_loops: int # 最大循环次数should_continue: bool # 是否继续循环next_step: str # 下一步操作tool_calls: list # 工具调用列表current_agent: str # 当前负责的智能体task: str # 当前任务task_result: str # 任务结果。

2026-04-19 01:07:23 39

原创 面向企业的 Agent 权限模型:最小权限、临时凭证与可撤销授权

企业级 Agent 是指在企业环境中运行,代表用户或系统执行特定任务的自动化实体。与传统软件不同,Agent 通常具有一定的自主性、反应性和社交能力(能够与其他 Agent 或系统交互)。Agent 的关键特征:自主性:能够在没有直接人工干预的情况下运行反应性:能够感知环境变化并做出响应主动性:能够主动设定并追求目标社交性:能够与其他 Agent 或系统协作完整的企业 Agent 权限模型应该包括以下核心组件:fill:#333;important;important;fill:none;

2026-04-19 00:18:53 71

原创 AI Agent Harness Engineering 的评测基准:GLUE、SuperGLUE 与真实业务指标

在一个不远的未来,AI智能体(Agent)已经成为我们数字生活中不可或缺的伙伴。早晨,你的个人助理Agent根据你的日程和实时交通状况智能调整了闹钟时间;工作中,你的代码助手Agent自动检测bug并提出修复方案;下班后,你的健康管理Agent根据你的饮食和运动数据推荐个性化的营养补充方案。这些场景看似科幻,但随着AI技术的快速发展,正逐渐成为现实。然而,在这些智能体为我们提供便利的背后,有一个至关重要却常被忽视的问题:我们如何准确评估这些AI Agent的性能?

2026-04-18 23:25:04 13

原创 Multi-Agent

本文将深入探讨多智能体系统(Multi-Agent Systems)的核心概念、工作原理和实际应用。我们将从单智能体的基础开始,逐步引入多智能体的概念,解释它们如何协作、竞争和交互。文章将包含生动的比喻、详细的技术解析、代码示例以及实际应用案例,帮助读者全面理解这一前沿AI领域。无论是AI研究者、开发者还是对AI未来感兴趣的读者,都能从本文中获得有价值的见解。想象一下,一个由单个超级英雄组成的团队与一个由多个各有所长的英雄组成的团队,哪个更强大?

2026-04-18 22:31:12 63

原创 “低代码” Agent 编排平台是伪命题吗?深入分析其技术边界与用户群体

本文深入探讨低代码Agent编排平台的本质、技术可行性与实际价值。通过第一性原理分析,我们解构了Agent编排的核心挑战,评估低代码抽象层级的适用性边界,并分析不同用户群体的真实需求与能力匹配度。文章建立了"能力-需求"匹配模型,提供了技术实现的数学框架与架构设计,最后通过实际案例与行业数据验证我们的结论。我们发现,低代码Agent编排平台在特定场景下具有显著价值,但在复杂认知任务中存在根本性限制,其真实价值取决于对"自动化"与"自主性"的精确定义与平衡。本体论问题:什么是"低代码Agent编排平台"?

2026-04-18 21:30:43 36

原创 AI Agent Harness Engineering 规划算法优化:基于Prompt Chain的任务拆解效率提升技巧

简单来说,传统的AI Agent规划(比如LangChain的默认PlanAndExecute、CrewAI的默认Sequential Planner)本质上是「单轮大模型一次性生成所有子任务」或者「双轮(大模型生成Plan → 再生成子任务的具体细节)」的线性逻辑大模型的「上下文窗口注意力限制」无法避免。

2026-04-18 20:30:12 155

原创 生产环境部署 AI Agent 的最佳实践

本文将从这五大维度出发,结合我在某头部互联网公司负责3个千万级日活AI Agent(包括智能客服、代码生成助手、企业知识问答机器人)部署的实战经验,分享一套从0到1、再从1到N的生产环境AI Agent部署最佳实践框架。Agent编排:LangGraph(而非LangChain Legacy/LlamaIndex Core的顺序链,因为生产环境90%以上的Agent需要复杂的决策分支、循环、错误处理)LLM网关。

2026-04-18 19:41:43 85

原创 为对话状态追踪设计 Harness 槽位填充助手

基于上述概念和技术,我们将创建一个名为"SlotHarness"的槽位填充助手项目。这个项目旨在为开发者提供一个全面的工具集,用于构建、评估和优化对话系统中的槽位填充组件。

2026-04-18 02:53:12 172

原创 实战指南:用 Python 从零构建一个具有全网搜索能力的 Research Agent

理解用户的研究请求生成和执行搜索查询提取和处理网页内容分析和整合信息生成结构化的研究报告。

2026-04-18 02:04:43 153

原创 如何设计AI Agent的容错机制:从超时重试到降级策略

在深入探讨具体的容错策略之前,让我们首先明确一些核心概念。容错机制(Fault Tolerance)是指系统在出现故障、错误或异常情况时,仍能继续正常运行的能力。对于AI Agent而言,容错机制确保了即使在面对各种不可预测的情况时,系统也能保持一定程度的功能,而不是完全崩溃。故障(Fault):系统内部的缺陷或问题,可能导致错误错误(Error):故障的表现,即系统状态偏离预期失败(Failure):系统无法提供预期的服务恢复(Recovery):系统从错误状态返回到正常状态的过程。

2026-04-18 01:04:12 78

原创 如何设计高效的Multi-Agent协作模式?从理论到实践

Agent(智能体):在经典AI理论里,Agent是“能感知环境、做出决策、并作用于环境的实体”;在大语言模型(LLM)驱动的AI应用里,Agent可以理解为“套了壳的LLM”——这个壳里有任务规划能力、工具调用能力、记忆存储能力、环境交互能力。Multi-Agent System(多智能体系统,简称MAS):由多个自主或半自主的Agent组成的系统,这些Agent通过通信、协作、竞争、协商等方式共同完成单个Agent难以或无法完成的任务。经典AI理论中的Agent定义最早由。

2026-04-18 00:10:20 193

原创 ReAct 模式详解:推理与行动如何让 AI 更智能

ReAct模式的全称是(推理与行动协同模式),是由普林斯顿大学、Google DeepMind、斯坦福大学联合发表的论文《ReAct: Synergizing Reasoning and Acting in Language Models》中提出的一种大语言模型落地新范式。简单来说,ReAct模式就是把推理(Reasoning)和行动(Acting)交替循环地嵌入到LLM的输出序列中,形成一个“

2026-04-17 23:09:48 90

原创 用 Agent 构建个人知识管理系统的完整方案

想象一下这个场景:你花了3小时啃完一篇前沿的AI论文,把核心公式、启发式想法、待验证的思路写在了Notion的三个不同页面里;上个月学的React Server Components,你用Obsidian记了笔记、画了思维导图,但现在想找RSC与Next.js App Router的性能对比数据,翻遍了三个工具的标签页和搜索框,才发现记在了Reddit评论的回复草稿箱里——连草稿箱都差点清空。这就是当代「数字松鼠症」患者的日常:我们收集了海量的知识碎片,却失去了整合知识、快速检索、关联灵感、自动整理。

2026-04-17 22:15:58 106

原创 内容创作Agent实战:自动生成爆款文章的秘诀

本文不会再给你灌“标题要有数字、要有悬念、要有冲突”“开头3秒要抓住用户眼球”这类你可能已经听腻了的空话套话——相反,我们会用理工科思维,把爆款文章的生产全流程,拆解成可量化的模块、可执行的步骤、可验证的指标,然后用LangChain+Claude 3.5 Sonnet(或者你喜欢的其他大模型API,比如GPT-4o、通义千问Max、智谱清言GLM-4 Flash Pro)搭建一套完整的AI内容创作Agent系统爆款选题自动挖掘。

2026-04-17 21:22:09 278

原创 Agent 的工具竞态:并发执行与资源锁

想象一下,你是一家快速增长的初创公司的技术负责人。经过数月的努力,你终于部署了一套基于多 Agent 的智能客服系统。这套系统由 10 个专门的 Agent 组成,每个 Agent 负责处理不同类型的客户查询:有的负责订单查询,有的负责退款处理,有的负责产品推荐。它们共享一套核心工具集,包括数据库连接池、支付网关接口和库存管理系统。上线的第一周,一切顺利。客户满意度飙升,人工客服的压力大幅减轻。然而,在一个星期五的午夜,当你正准备享受周末时,监控系统突然发出警报:数据库连接池耗尽,支付处理出现大量重复交易,

2026-04-17 20:21:39 273

原创 企业级Multi-Agent部署拓扑:单体、微服务与Serverless架构对比

企业级应用的数字化转型正从“单智化工具”向“协作式生态系统”跃迁——Multi-Agent(多智能体)技术凭借其任务拆解、分工协作、容错冗余等特性,已成为客服机器人集群、金融风控决策链、工业智能制造调度、科学研究模拟协作等复杂场景的核心解决方案。但在Multi-Agent技术的“最后一公里”落地中,

2026-04-17 19:27:49 275

原创 AI Agent Harness Engineering 在政府与公共机构的应用前景

本文将深入探讨AI Agent Harness Engineering(AI代理工程)在政府与公共机构中的应用前景。我们将从基本概念入手,逐步展开到技术架构、应用场景、实施策略、伦理考量等多个维度。解析AI Agent的核心概念和技术架构分析政府与公共机构的典型痛点和需求探索AI Agent在公共服务中的具体应用场景提供AI Agent系统的设计与实施指南讨论AI Agent在公共领域应用的伦理、安全和合规问题展望这一技术的未来发展趋势。

2026-04-17 02:33:58 223

原创 并行协作的竞态治理:去重、锁、幂等与最终一致的工程方案

去重(Deduplication):通过识别和消除重复操作来避免竞态锁(Locking):通过互斥机制确保资源的有序访问幂等(Idempotency):通过设计使得操作可以重复执行而不产生副作用最终一致性(Eventual Consistency):通过放宽即时一致性要求来提高系统可用性和性能我们不仅会讲解这些概念的原理,还会通过实际的代码示例、架构图和数学模型,展示如何在工程项目中综合应用这些方案来构建健壮的分布式系统。

2026-04-17 01:45:27 217

原创 为 Agent 评估设计离线 Harness 回放模式

一条历史轨迹TTTTs0s1snTs0​s1​...sn​其中每个状态sts_tst​stitctotaotertst​it​ct​ota​ote​rt​iti_tit​:t时刻的用户输入ctc_tct​:t时刻的上下文窗口otao^a_tota​:t时刻旧Agent的输出oteo^e_tote​:t时刻环境的输出(工具返回等)rt。

2026-04-17 00:44:57 317

原创 开源工具链全景图:2026年最值得关注的AI Agent开源项目汇总

当GPT-4o Mini这样的“轻量且全能”的LLM成为2025-2026年的技术基础设施,AI Agent的平民化浪潮终于不再是PPT上的愿景——开发者不再需要自己训练大模型,而是可以通过一套标准化、模块化、可扩展的开源工具链,像搭乐高积木一样组装出能解决复杂问题的智能体。背景:从“单Agent聊天机器人”到“企业级多Agent任务流水线”的需求跃迁核心概念:用“数字城市运作系统”的生活化比喻,拆解Agent的6大核心模块(大脑、感知、记忆、行动、反思、社交)及工具链的5层架构技术原理与实现。

2026-04-16 23:51:07 147

原创 Harness 中的响应合并:将多个片段组装为完整输出

现代DevOps为了提升交付速度,并行化Pipeline步骤已经成为标配——比如并行运行单元测试、集成测试、端到端测试,并行扫描代码库的SAST/DAST/SCA漏洞,并行部署到AWS的多个Region/AZ,并行收集多个服务的健康检查日志或性能指标。并行步骤产生的输出是分散的、独立的“片段”——可能是多个Junit XML报告、多个Snyk JSON漏洞列表、多个Prometheus指标文件、多个Postman Newman HTML结果,甚至是多个微服务的部署状态通知。

2026-04-16 22:57:17 121

原创 基于拓扑排序的 Harness 依赖解析

背景与基础概念:介绍Harness CD的基本架构、YAML配置的核心结构、企业级CD流水线的常见依赖类型;拓扑排序的理论基础:包括有向无环图(DAG)的定义与判定、拓扑排序的数学模型、Kahn算法与DFS后序遍历算法的详细实现与对比;Harness依赖解析的底层原理:从Harness YAML中提取依赖关系的方法、如何将这些依赖关系转化为DAG、Harness CD引擎如何用拓扑排序生成执行计划;实战:基于Python实现Harness依赖解析工具。

2026-04-16 21:56:49 108

原创 AI Agent Harness Engineering 的性能指标体系:响应时间、准确率与吞吐量的完整测量

本文将深入探讨AI Agent Harness Engineering(AI代理框架工程)中的性能指标体系,重点关注响应时间、准确率和吞吐量这三个核心指标。我们将从理论基础出发,逐步深入到实际测量方法和优化策略,为你提供一套完整的AI代理性能评估与优化指南。AI Agent Harness Engineering的核心概念和架构性能指标体系的设计原则和方法论响应时间的定义、测量方法和优化策略准确率的评估标准、测量方法和提升技巧吞吐量的计算方式、测量工具和扩展方案。

2026-04-16 20:56:18 255

原创 AI Agent Harness Engineering 的持续学习与适应:如何让智能体永不落伍?

在快速发展的AI时代,构建能够持续学习和适应的智能体(Agent)已经成为关键挑战。本文深入探讨AI Agent Harness Engineering的核心概念,详细解析如何设计和实现具有持续学习能力的智能体系统。我们将从问题背景出发,逐步介绍核心概念、技术原理、实现方法,并通过实际案例展示如何让智能体在动态环境中"永不落伍"。文章包含丰富的代码示例、数学模型和架构设计,适合AI从业者、研究人员和开发者阅读。想象一下,你花费数月时间训练了一个AI客服机器人,它能够完美回答客户关于产品A的问题。

2026-04-16 19:55:49 179

原创 LangGraph工作流引擎到工程实践的量化分析

上周帮一家做ToB法律咨询AI助手的客户复盘:他们用纯LangChain的和跑了2个月,结果差强人意——42分(及格线60)每月12.7万人民币(其中无效循环/冗余节点调用占比68%)37%(主要是合同条款冲突分析这类需要多轮结构化推理+状态回溯的场景直接挂)每次调整Prompt模板需要1.2周调优测试,上线后逻辑复用率不足10%上周我临时帮他们把核心的「合同合规性审查」流程改成LangGraph,加了状态量化校验冗余节点自动剪枝阈值LLM调用Token成本动态限制三个简单的量化组件——

2026-04-16 19:01:57 294

原创 多智能体自治会带来新型企业组织结构吗

传统企业有明确的法律和组织边界。但如果企业由大量自治的智能体组成,这些智能体可能跨越组织边界进行协作,那么企业的边界将变得模糊。这将如何影响企业的治理、责任和竞争优势?

2026-04-16 02:08:07 310

原创 用顺序一致性模型验证 Harness 并发正确性

在现代软件工程中,并发编程已经成为构建高性能、可扩展系统的基石。然而,并发程序的正确性验证一直是软件开发中最具挑战性的任务之一。当多个线程或进程同时执行时,它们的交互可能会产生难以预测的结果,即使每个单独的线程看起来都是正确的。在本文中,我们将深入探讨如何使用顺序一致性(Sequential Consistency, SC)模型来验证 Harness 并发测试框架的正确性。Harness 是一个强大的并发测试工具,它允许开发者编写和执行复杂的并发测试场景。然而,要确保 Harness 本身的正确性,我们需要

2026-04-16 01:14:16 359

原创 销售助理 Agent:从线索筛选到会议纪要的端到端自动化

这就是销售助理 Agent 可以大显身手的地方。销售助理 Agent 是一种基于人工智能的自动化系统,它能够模拟人类销售助理的工作流程,从线索筛选到会议纪要,实现端到端的自动化。但这不仅仅是简单的任务自动化。现代的销售助理 Agent 结合了自然语言处理(NLP)、机器学习(ML)、知识图谱(KG)和大语言模型(LLM)等先进技术,能够理解上下文、学习经验、做出判断,甚至进行一定程度的自主决策。会议纪要的核心是文本摘要。提取式摘要:从原文中选择最重要的句子组合成摘要抽象式摘要。

2026-04-16 00:13:57 330

原创 AI Agent Harness Engineering 数据处理流程:采集、清洗、分析与知识提取

如今的AI Agent市场如火如荼——从能帮你订机票的Copilot,到能自动处理工单的客服助手,再到能进行代码审查的开发伙伴,Agent的应用场景正在从消费端快速渗透到金融、医疗、制造、教育等各个垂直行业的核心业务中。然而,行业落地的过程中暴露了一个最普遍、最致命的痛点绝大多数Agent只能“听指令”,不能“懂业务”

2026-04-15 23:19:57 126

原创 MCP协议深度解析:从工具标准化到生态互联

模型上下文协议(Model Context Protocol,MCP)作为Anthropic在2024年4月推出的开源协议,正在彻底改变大语言模型(LLM)与外部工具、数据、环境交互的方式——它不再是Claude的“专属玩具”,而是有望成为全球AI生态中Agent、AI助手、甚至普通软件之间“语言统一”的基础设施。本文将从用户遇到的“跨Agent工具调用重复造轮子”“数据上下文难长期保留且共享”“现有工具接口标准混乱导致集成成本高”三大核心痛点切入,一步步。

2026-04-15 22:26:07 123

原创 Harness 中的自适应序列化:权衡速度与大小

想象一下,如果你的汽车只有一个档位,会发生什么?在城市道路上行驶会太慢,在高速公路上会太耗油。对于研究实验,我们可能更看重兼容性和功能完整性对于移动部署,模型大小可能是首要考虑因素对于高吞吐量在线推理,反序列化速度至关重要对于边缘设备,我们可能需要同时优化速度和大小自适应序列化的核心思想是:根据具体的使用场景、硬件条件、模型特性和性能需求,动态选择最佳的序列化策略,实现速度与大小(以及其他目标)的智能权衡。

2026-04-15 21:32:18 67

原创 AI Agent Harness Engineering 的容错机制与异常处理

在构建复杂的AI系统时,AI Agent(智能体)作为核心组件,其稳定性和可靠性至关重要。本文将深入探讨AI Agent Harness Engineering中的容错机制与异常处理策略,通过生动的比喻、详细的技术解析和实用的代码示例,帮助读者理解如何构建更加鲁棒的AI智能体系统。我们将从基本概念开始,逐步深入到技术原理、实现方法、实际应用案例,最后展望未来发展趋势。想象一下,你正在驾驶一辆自动驾驶汽车,突然遇到了一个从未见过的交通标志,或者前方道路出现了意外状况。在这种关键时刻,系统不能简单地崩溃或停止工

2026-04-15 20:31:46 261

原创 基于业务目标的Agent自动化评测体系设计:超越准确率的有效性衡量

我们还是以电商全链路服务Agent我们还是以电商全链路服务Agent。

2026-04-15 19:31:16 233

原创 红队测试:攻击你的 Agent Harness 以发现漏洞

在讲解 Agent Harness 之前,我们先来看一下AI Agent(智能体)的定义——根据斯坦福大学 2023 年发表的论文《Generative Agents: Interactive Simulacra of Human Behavior》,AI Agent 是一个具备“感知能力(Perception)、思考能力(Reasoning)、行动能力(Action)、记忆能力(Memory)”的自主系统,它可以根据用户的指令或环境的变化,自主地完成一系列复杂的任务。那什么是。

2026-04-15 02:42:46 318

原创 构建 Agent 即服务平台

简单来说,Agent即服务平台是一套面向Agent全生命周期的云原生PaaS平台标准化Agent开发框架:屏蔽大模型API、向量数据库、动作插件、知识库的底层差异,提供统一的SDK/低代码/无代码开发界面;多维度Agent资产管理:支持Agent、Prompt、动作插件、知识库、微调模型的统一存储、版本管理、权限控制和复用;高性能Agent部署与运行:提供容器化部署、自动扩缩容、负载均衡、对话历史持久化、容错重试机制;全链路Agent监控与优化。

2026-04-15 01:48:57 382

原创 Agent 的在线评测:A_B 测试与真实用户反馈

在深入讨论评测方法之前,我们首先需要明确 Agent 的定义。在人工智能和计算机科学领域,Agent 是指能够感知环境、做出决策并采取行动的自主实体。感知器:负责收集环境信息知识库/记忆系统:存储历史信息和领域知识推理引擎:基于感知信息和知识进行决策执行器:将决策转化为实际行动反应型 Agent:直接根据当前感知做出反应,不依赖历史信息基于模型的 Agent:拥有环境模型,能够预测行动结果目标导向型 Agent:以实现特定目标为导向进行决策效用最大化 Agent。

2026-04-15 00:55:07 330

原创 一文读懂:状态管理在Agent中的关键作用与实现

本文将带你深入探索状态管理在Agent系统中的关键作用与实现方法。我们将从状态管理的基础概念出发,逐步引入Agent系统的特点,探讨状态管理在Agent系统中的特殊需求,然后介绍几种常见的Agent状态管理实现方案,并通过一个具体的实战案例来演示如何在实际项目中应用这些概念。在深入探讨Agent状态管理之前,我们需要明确什么是Agent。Agent是一个在特定环境中运行的、具有自主性、反应性、主动性和社会性的计算实体。它可以感知环境,通过推理做出决策,并执行动作来改变环境或自身状态。

2026-04-15 00:06:37 206

原创 具身智能(Embodied AI):当 Agent 拥有了物理世界的身体

第一代AI(符号主义/专家系统):相当于人类婴儿只会说“妈妈爸爸”“这是苹果”——靠人类硬编码的符号规则和知识库,处理结构化、确定性极强的问题;第二代AI(连接主义/深度学习):相当于人类儿童学会了看书、看视频、听故事——靠海量的人类标注数据和黑箱式的神经网络,处理非结构化、弱确定性的问题(比如图像识别、语音合成、自然语言理解);现在,我们正站在第三代AI(具身智能)的门槛上:相当于人类少年开始“走出家门”“动手实践”——靠与真实物理世界(或高保真的物理仿真环境)的。

2026-04-14 23:12:45 78

原创 用系统提示词工程替代部分 Agent 框架的激进实践

要理解为什么“系统提示词工程替代部分 Agent 框架”是一个有价值的激进实践主流 Agent 框架到底解决了什么“显性问题”?又制造了什么“隐性问题”?系统提示词工程(System Prompt Engineering,后面简称 SPE)为什么能解决这些“隐性问题”,同时覆盖 80% 的“显性问题”?主流框架的显性价值承诺(来自官网、爆款教程):比如“自动决定先查天气再订机票”;比如“记住用户之前问过的宠物信息”;比如“把 PDF 上传后自动分块、向量化、检索增强”;

2026-04-14 22:24:14 129

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除