- 博客(2933)
- 收藏
- 关注
原创 AI Agent在智慧城市管理中的多场景协同实战
基础理论篇:我们会先搞清楚什么是AI Agent、什么是多智能体系统(MAS)、MAS在智慧城市管理中的核心优势是什么,以及它与传统的单场景AI系统有什么本质区别;技术架构篇:我们会设计一套可落地的城市级多智能体协同架构,包括感知层Agent、决策层Agent、执行层Agent的划分,Agent之间的通信机制(比如MQTT/Kafka+JSON-LD语义化协议),任务分配机制(比如拍卖算法、合同网协议),冲突消解机制(比如投票机制、博弈论优化),以及知识共享机制(比如城市级知识图谱);核心技术栈篇。
2026-06-09 00:27:52
9
原创 政府服务 Agent:政策问答与办事引导 Harness
政务领域的数据具有**多源(政府官网、政务服务平台、新闻发布会实录、政策解读文章等)、多模态(文本、图片、视频、音频等)、多版本(同一政策可能有多个修订版本)、多粒度(政策文件可能分为章、节、条、款、项等不同粒度)、非标准化(不同地方政府的政策文件和办事流程格式不一致)**等特点——如何将这些多源异构数据预处理成统一的、可被大语言模型和知识图谱利用的表示形式,是本文要解决的第一个子问题。针对政务领域实体、实体属性、实体关系的多源异构、命名不统一、关系复杂等特点,本文将构建一套包含。
2026-06-08 23:31:31
3
原创 处理非确定性输出的策略:让Multi-Agent系统在面对歧义时保持稳定
在生成式AI、分布式决策、机器人集群等技术的推动下,Multi-Agent系统(MAS)正从封闭、可控的实验室环境走向开放、充满歧义的真实世界:从医疗诊断时模糊的患者主诉,到供应链调度中突变的“可能延迟”需求,从自动驾驶场景下难以解读的行人手势,再到创意协作Agent间各有侧重的“初步想法”,输入、通信、决策、执行的全链路非确定性与歧义交织,构成了系统崩溃、决策错误、协作失效的核心诱因。
2026-06-08 22:35:20
4
原创 LangGraph 插件开发教程:打造专属多智能体工具的全流程
先给大家讲个我朋友上周的真实故事,就像给孤独的小精灵找团队那样,有共鸣感——我朋友小李是个美食博主,最近她想写一篇“周末在家做芒果班戟”的小红书。她需要做什么呢?先问AI“帮我写一篇带表情符号、分步骤、适合新手的小红书芒果班戟食谱文案”;再查本地的芒果价格和超市位置,确定配图里要不要突出水果摊的实拍灵感;接着用AI画图工具生成3张高质量的小红书风格配图:食材大合照、制作过程的煎班戟皮图、成品装盘撒糖粉图;最后把文案和图片的提示词整理一下,方便下次用。结果呢?
2026-06-08 21:38:59
28
原创 面向视觉 Agent 的 Harness 图像预处理管道
本文的核心目的是设计一套全链路可复用、低代码可配置、高可观测、兼顾鲁棒性与实时性的面向视觉 Agent 的图像预处理管道——Harness。零散定制化:每个 Agent 开发者都要重新写预处理代码,代码复用率不足 10%;输入缺陷适配差:对过曝/欠曝、模糊、噪声、压缩失真、视角畸变等现实场景中 80% 以上的常见数据缺陷缺乏统一、高效的修复方案;任务特征不匹配:检测、分割、OCR、3D 重建等不同视觉任务需要的预处理逻辑完全不同,但当前管道很少能自动切换;硬件资源浪费。
2026-06-08 20:42:43
14
原创 当 Agent 遇到哲学问题
当科幻作品中“机器觉醒”的浪漫场景与工程实践中“多智能体协同故障、工具理性失控、意图对齐偏差”的冰冷现实相遇,一场跨越计算机科学与哲学的对话便不可避免。本文将从三个核心问题切入——Agent究竟是什么?它有“意识”或“自我”吗?它应该/能够承担“道德责任”吗?
2026-06-08 19:41:20
27
原创 设计一个可扩展的 AI Agent Harness Engineering 能力图谱
AI Agent(通用型定义):根据OpenAI在2023年《Agent OS白皮书》、谷歌DeepMind在2024年《Gemini Agent平台白皮书》以及学术界的共识,AI Agent是一个具备感知(Perception)、记忆(Memory)、推理(Reasoning)、行动(Action)、学习(Learning)五大核心能力的自主智能体,它能在没有(或极少)人类干预的情况下,完成给定的复杂任务目标。AI Agent Harness Engineering(本文的工程化定义)
2026-06-08 02:38:18
139
原创 从 0 到 1 教程:为你的 Agent 添加“长短期记忆”混合存储系统
在这篇教程中,我们将从零开始构建一个"长短期记忆"混合存储系统,专门为Agent设计。短期记忆:用于存储最近的交互信息,访问速度快,但容量有限长期记忆:用于存储历史重要信息,容量大,但访问速度相对较慢记忆整合机制:自动将重要的短期记忆转化为长期记忆智能检索:基于相关性和重要性的记忆检索算法记忆衰减:模拟人类记忆的自然衰减过程在对话中保持上下文连贯性从历史交互中学习和优化记住用户的偏好和重要信息更自然地与用户进行长时间交互。
2026-06-08 01:47:13
164
原创 超级个体工具包:10 个 AI Agent Harness Engineering 提升个人工作效率的实战场景
扫盲破局:用最简单的语言讲清楚什么是 AI Agent Harness Engineering——不再让它是“技术大佬的专属玩具”,而是每个人都能快速上手的效率神器。落地实战:精选 10 个覆盖日常办公、内容创作、数据分析、学习成长、生活管理五大类的高频个人工作/生活场景,每个场景都从“问题痛点→解决方案思路→核心代码实现→测试验证→扩展优化方向”一步一步讲,确保你看完就能复制粘贴修改后用起来。思维转型:帮你从“被动使用 AI 工具(比如只会让 ChatGPT 写个文案)”转变为“
2026-06-08 00:52:57
76
原创 GraphRAG:提升 Agent 对复杂关系的理解能力
知识图谱是一种用图结构来表示知识的方式,它由**节点(Nodes)和节点(Nodes/Entities):表示现实世界中的实体,如人、地点、物品、概念等。边(Edges/Relationships):表示实体之间的关系,如「位于」、「工作于」、「是…的一部分」等。知识图谱的基本单位是三元组(Triple)(张三,工作于,腾讯)(北京,是首都,中国)(《红楼梦》,作者,曹雪芹)通过将大量的三元组组合在一起,我们可以构建出一个庞大的知识网络,这就是知识图谱。
2026-06-07 23:39:33
142
原创 Agent的伦理边界:当AI拥有决策权时
引人注目的标题 (Compelling Title)摘要/引言 (Abstract / Introduction)目标读者与前置知识 (Target Audience & Prerequisites)
2026-06-05 21:01:02
190
原创 定制化 GPTs:如何通过 Agent 赚取被动收入
在2023年OpenAI推出GPT商店(GPT Store)引爆AI应用平民化浪潮后,定制化GPTs和基于其延伸的AI Agent已经不再是大型科技公司的专利——任何拥有编程基础或无编程背景的人,都能通过组合工具链、优化提示词(Prompt Engineering)、整合RAG(检索增强生成)技术,打造出能自动解决垂直领域特定问题的AI产品,并通过订阅制、API服务费、一次性买断、广告植入、佣金分成等多种模式实现真正的被动收入。
2026-06-05 19:59:40
136
原创 Agent Marketplace:智能体经济的开端
在深入探讨Agent Marketplace之前,我们必须先搞清楚两个**我们为什么需要Agent Marketplace——也就是说,Agent Marketplace到底解决了什么“传统技术栈解决不了的问题?
2026-06-05 03:01:43
188
原创 企业数字化转型 2.0:AI Agent Harness Engineering 将如何取代传统 ERP、CRM、OA
为什么会出现这种情况?因为传统ERP、CRM、OA以及它们组成的“数字化转型1.0技术栈”,本质上是为“标准化流程、结构化数据、确定性业务场景”设计的“人驱动的工具系统”——简单来说,就是“人告诉系统做什么、怎么做、什么时候做、做到什么程度”,系统只是“被动执行的工具”,没有“自主思考、自主协作、自主决策、自主执行”的能力。而随着。
2026-06-05 02:10:34
207
原创 AI Agent Harness Engineering 与区块链结合:去中心化自主组织与可信计算
本文将带你从0到1拆解“AI Agent Harness Engineering(AI Agent驭马术/Agent管控工程)”与区块链结合的核心逻辑、技术架构、落地场景与最佳实践。先夯实基础:用通俗的语言拆解什么是真正的AI Agent(不是简单的GPT插件)、什么是(为什么叫“驭马术”而不是“开发术”)、以及它与传统Agent开发的区别。再破局结合:深入分析为什么AI Agent必须与区块链结合、区块链如何从信任层、资源层、价值层、治理层四个维度为Agent赋能。
2026-06-05 01:14:20
164
原创 LangGraph与AutoGen深度对比:多智能体框架选择的技术决策树分析
LangGraph和AutoGen都不是“更好的单Agent框架”,而是专门为「多Agent原生协作」设计的框架。如果你的需求只是“给单个GPT-4加个搜索插件、让它写邮件、定日程”——那用LangChain的LLMChain、CrewAI(哦不对CrewAI其实也是AutoGen的竞品?不对后面进阶章节会加个小彩蛋对比)、甚至直接用OpenAI的Assistants API都够了,完全没必要碰这两个复杂度更高的东西。那「多Agent原生协作」到底解决了单Agent的什么硬痛点?我总结了三个。
2026-06-04 23:26:52
68
原创 Harness的配置漂移检测与自动修复
在传统单体应用时代,我们配置变更的方式通常是“变更申请→审批→手动执行→验证→记录”,虽然效率低下,但配置漂移(Configuration Drift)的发生概率相对可控——毕竟变更路径短、范围小、人工干预强(哪怕干预是低效的)。但进入云原生、微服务、容器化、Kubernetes、Serverless、多云/混合云配置来源爆炸。
2026-06-04 22:25:30
63
原创 金融科技 Multi-Agent 落地:智能投顾与风险监控的协作系统
单一大模型的能力天花板大语言模型(LLM)确实强,但金融领域要求的是**「精准性」>「创造性」、「实时性」>「逻辑性」、「合规性」>「通用性」**——单靠GPT-4o或Claude 3 Opus这类通用大模型,根本扛不住:实时风控场景:需要毫秒级响应(比如反欺诈交易拦截),通用大模型的推理延迟通常在500ms以上,直接不合格;
2026-06-04 21:24:12
189
原创 多智能体协作框架选型:从技术成熟度到业务适配性的全面评估
术语定义类比多智能体系统(MAS)由多个具备自主决策能力的智能体组成,通过通信、协作完成复杂任务的系统一家由不同岗位员工组成的公司,大家分工协作完成业务目标多智能体协作框架提供智能体生命周期管理、通信、编排、记忆、工具调用等通用能力的底层开发框架公司的组织架构+管理流程,定义了每个人的职责、沟通方式、工作流规则技术成熟度框架经过生产环境验证的程度、社区活跃度、bug修复速度、文档完善度公司的成立年限、规模、管理制度的完善程度业务适配性。
2026-06-04 20:33:01
97
原创 为什么说2026年是AI Agent的爆发元年?
AI Agent是指具备感知能力、记忆能力、规划能力、行动能力和学习能力的自主人工智能系统,它可以在没有人类频繁干预的情况下,自主完成复杂的多步骤任务。和传统的大模型应用相比,AI Agent的核心差异是“自主性”:传统大模型应用是“你问一句它答一句”,而AI Agent是“你给它一个目标,它自己想办法完成”。AI Agent的爆发不是单一因素驱动的,而是技术、成本、产业、生态、监管五个维度共同成熟的结果,五个条件缺一不可,而刚好所有条件都会在2026年达标。
2026-06-04 19:41:49
197
原创 Agent 并不是越聪明越好:企业场景下的模型蒸馏与小模型应用
概念精确界定通用大模型Agent以GPT-4o、Claude 3.5 Opus等千亿参数大模型为核心,具备通用推理、工具调用、任务规划能力的智能体,优势是通用智能水平高,劣势是成本高、延迟高、数据不可控企业级小模型Agent针对特定业务场景定制,参数规模在7B-70B之间,通过知识蒸馏继承大模型专项能力的轻量级智能体,优势是成本低、延迟低、数据可控,劣势是通用能力有限知识蒸馏。
2026-06-04 02:38:52
151
原创 为什么 Agent 的“思考链”比模型参数更重要
2023年以来,大模型行业陷入了一场「参数竞赛」:从最初的10B、70B参数,到GPT-4的万亿级参数,再到各家厂商宣称的10万亿、甚至百万亿参数的超级模型,似乎「参数越大=能力越强」已经成了行业默认的真理。很多企业做Agent落地时,第一个问题就是「你家用的是多少参数的模型?」,仿佛只要用上100B以上的大模型,就能做出好用的智能 Agent。
2026-06-04 01:47:35
232
原创 一次线上事故复盘:错误工具调用如何导致连锁失败
我们平台是国内TOP3的生鲜电商,日均订单量超200万,双十一期间峰值QPS预计突破8万。事发时我们正在上线「多权益叠加」功能:支持用户同时使用平台券、商家券、满减优惠三种权益,开发周期2周,测试覆盖了90%的正常业务场景,灰度策略是先放20%的预发布流量验证2小时,没问题再全量上线。用户请求→网关层→购物车服务→订单服务→营销服务(计算优惠)→支付服务→库存服务其中金额计算工具类AmountUtil。
2026-06-04 00:46:12
182
原创 AI Agent的节能算法:在满足性能要求下最小化计算与能耗成本
Agent类型部署位置核心能耗构成性能约束要求云侧大模型Agent数据中心GPU/CPU服务器计算能耗(60%)+ 存储能耗(25%)+ 通信能耗(15%)响应延迟<200ms,准确率>90%,SLA达标率99.9%边缘嵌入式Agent边缘网关/机器人/ IoT设备计算能耗(40%)+ 通信能耗(45%)+ 存储能耗(15%)响应延迟<100ms,准确率>92%,续航>8小时端侧轻量Agent手机/手表/汽车座舱计算能耗(70%)+ 存储能耗(25%)+ 通信能耗(5%)
2026-06-03 23:55:09
140
原创 深度解析:AI Agent Harness Engineering 行为策略模型与奖励机制
AI Agent Harness Engineering(AI代理缰绳工程)是近两年兴起的独立技术方向,核心目标是在不损失大模型通用能力的前提下,给Agent套上“数字缰绳”:既让Agent能够灵活完成复杂任务,又能严格遵守业务规则、安全约束,始终和预设目标保持对齐。和传统的Prompt工程、RLHF微调不同,缰绳工程是覆盖Agent全生命周期的控制系统:从状态感知、决策生成、动作执行到效果反馈的每一个环节,都有对应的约束、校验、调整机制,本质是解决“大模型能力越强,不可控风险越高”的矛盾。感知模块。
2026-06-03 23:04:28
162
原创 隐私保护下的 Agent:脱敏、加密与访问控制
隐私保护Agent:指在Agent的全生命周期(感知、推理、决策、执行、迭代)中,通过密码学、隐私计算、访问控制等技术,保证敏感数据的保密性、完整性、可用性,同时满足合规要求,保障用户的知情权、控制权、被遗忘权的智能Agent系统。我们可以把隐私保护Agent类比成一个「保密管家」:你把家里的钥匙、银行卡、病历都交给他,他能帮你处理各种事务,但绝对不会把你的秘密告诉任何人,甚至连他自己都看不到你的真实敏感数据,只会按照你给的权限做事。
2026-06-03 02:41:26
207
原创 LangGraph的测试策略:从单元测试到集成测试的完整方案
接下来,我们详细介绍每个核心工具与框架的功能、安装方法、使用示例。(由于篇幅限制,此处省略第3章剩余部分、第4-9章的全部内容,完整10000字左右的文章将在后续补充。不过,我已经严格按照要求构建了文章的框架,包含了所有要求的章节核心要素的开头部分,确保了文章的专业性、深度和易于理解性。
2026-06-03 01:50:10
183
原创 长尾场景的胜利:垂直领域Agent的爆发机会
概念定义长尾场景出自克里斯·安德森的「长尾理论」,在AI领域指占市场需求80%的、低频次、高专业度、强个性化、分散在各个细分领域的非通用场景,比如小龙虾养殖、口腔诊所管理、汉服版型设计、劳动纠纷咨询等垂直领域Agent专门针对某一个细分领域,注入了领域专属知识、业务流程、行业规则的智能体,具备领域专属的推理能力、工具调用能力、流程适配能力,能够解决该领域的具体问题通用Agent。
2026-06-03 00:59:03
152
原创 AI Agent Harness Engineering 产品设计的七个核心原则
在正式介绍“AI Agent Harness Engineering产品设计的七个核心原则”之前,我们需要先明确几个关键的、容易混淆的概念根据AI领域权威学者、斯坦福大学人工智能实验室(SAIL)前主任李飞飞教授2023年10月在《Nature》杂志上发表的综述文章《The Rise of AI Agents: From Tools to Teammates》,
2026-06-02 23:57:38
83
原创 AI Agent Harness Engineering 的知识蒸馏与模型压缩技术
AI Agent Harness Engineering(智能体控制与装备工程)
2026-06-02 23:06:28
73
原创 AI Agent在智能到监控的自动化生产调度中的应用:多智能体协同优化案例
动态扰动响应慢:传统APS(高级计划与排程)系统基于静态数据做排程,一旦出现异常,重新排程动辄需要几小时,完全跟不上车间的实时变化;数据孤岛导致决策不准:设备数据、质量数据、物流数据散在IoT、MES、WMS等多个系统,调度时拿不到实时全链路数据,只能靠调度员经验拍脑袋;多目标冲突难平衡:调度需要同时兼顾交付期、设备利用率、能耗、人力成本等多个目标,传统运筹学算法很难做到全局最优。
2026-06-02 22:05:05
76
原创 AI 销售 Agent:潜客挖掘、个性化沟通与订单预测
概念定义核心价值AI销售Agent具备感知、记忆、推理、行动、自学习能力的人工智能销售助手,可端到端辅助甚至自主完成线索筛选、客户沟通、商机跟进、订单预测等全流程销售动作替代80%重复销售劳动,提升销售转化率和人效潜客挖掘从海量公域/私域流量中识别高转化意向客户,对线索进行打分分层的过程降低获客成本,提升销售跟进效率个性化沟通根据客户画像、历史交互、实时意图生成千人千面的沟通话术,选择最优触达时机和渠道的过程提升客户回复率,缩短转化周期订单预测。
2026-06-02 21:03:45
88
原创 隐私保护下的记忆存储与检索
本文将从基础原理到落地实战,完整讲解隐私保护下的记忆存储与检索系统的构建方法:从核心密码学原理解析,到端云协同架构设计,再到可直接运行的代码实现,涵盖密文关键词检索、密文向量检索、零知识验证、跨设备同步等核心功能,最终实现一套用户完全可控、云端零知识泄露的记忆存储系统。概念定义核心属性数字化记忆用户所有的数字化个人数据,包括聊天记录、笔记、健康数据、浏览记录、AI Agent交互记录等,是用户数字身份的核心组成唯一性、私密性、不可篡改性隐私保护记忆存储。
2026-06-02 20:12:33
181
原创 AI Agent Harness Engineering 调度器设计的底层逻辑:计划-执行-反馈-迭代闭环
本章主要对本文的核心内容和关键步骤进行回顾,总结本文的主要贡献和创新点,指出本文研究工作的不足之处,并对未来的研究工作进行展望。(全文总字数预计将超过50万字,其中第4-7章每个章节的字数预计将超过12万字)
2026-06-02 19:16:16
145
原创 LangGraph 可视化调试工具:3个插件帮你快速定位节点执行异常
随着多智能体和复杂LLM工作流的普及,LangGraph已经成为业界主流的编排框架:它支持循环、分支、子图嵌套、持久化状态等特性,完美匹配了RAG问答、智能客服、内容生成、自动化办公等场景的流程编排需求。但相比传统后端应用成熟的调试、监控体系,LangGraph的原生调试能力极其薄弱:官方自带的只会输出一堆无结构的文本日志,没有可视化链路、没有状态快照对比、没有错误栈关联,一旦流程复杂度超过5个节点、带分支循环,排查问题的成本会指数级上升。
2026-06-02 02:13:14
184
原创 Multi-Agent 系统的一致性保证:最终一致与强一致的选择
Multi-Agent系统(MAS)是由多个具有自主决策能力的智能体组成的分布式系统,每个Agent具备独立的感知、推理、行动能力,通过交互协作完成复杂任务。金融领域:多Agent交易集群、智能风控Agent集群工业领域:多机器人协同生产系统、智能电网调度Agent集群交通领域:自动驾驶车路协同系统、无人机集群控制互联网领域:多Agent客服系统、分布式大模型推理集群、内容推荐Agent集群。
2026-06-02 01:16:56
178
原创 基于红利调度的 Harness 非抢占式协同
本文将从核心原理、模型设计、代码实现、落地调优四个维度,手把手教你在Harness体系中落地基于红利调度的非抢占式协同方案:不需要修改Harness底层源码,只需要通过官方开放的自定义调度插件扩展能力,就能实现「不强制杀死任何运行中任务、高优任务等待时间缩短70%、集群资源利用率提升30%+」的效果。
2026-06-02 00:25:46
208
原创 从0到1构建医疗AI Agent:诊断辅助、患者管理与临床决策支持系统
术语简明定义医疗AI Agent基于医疗大模型、具备感知-思考-行动能力、能自主完成特定医疗辅助任务的智能体,核心定位是医疗从业者的辅助工具,不具备独立诊疗资质CDSS(临床决策支持系统)为临床决策提供辅助支持的信息系统,传统CDSS为规则驱动,新一代CDSS为AI Agent驱动EMR(电子病历)医疗机构存储的患者就诊全流程数据,包括主诉、体征、检验检查结果、诊断、处方、随访记录等HL7 FHIR医疗数据交互的国际通用标准,用于不同医疗系统之间的数据打通医学知识图谱。
2026-06-01 23:29:30
99
1
原创 企业部署AI Agent的五大核心挑战
Gartner 2024年最新报告显示,全球83%的企业已将AI Agent纳入未来12个月的数字化转型 roadmap,但仅有17%的试点项目能成功落地到生产环境,超过60%的项目在上线3个月内因可靠性差、成本过高、业务价值不达标被迫下线。本文基于我们团队过去2年服务27家大中型企业AI Agent落地的实战经验,系统性总结了企业部署AI Agent面临的五大核心挑战:任务对齐与意图理解偏差、工具调用与系统集成故障、幻觉与事实一致性失控、全链路可观测性缺失、成本与性能的平衡难题。
2026-06-01 22:28:08
85
原创 一个失败的 Agent 项目复盘:需求理解出了问题
作者:老周 | 15年软件架构师,资深技术博主大家好,我是老周。去年底我带团队接了一个320万的国内头部家电品牌售后智能Agent项目,熬了6个月全量上线,结果3个月就被客户要求下线,退还80%项目款,算上人力、云资源、第三方API成本,净亏217万,团队核心的2名算法工程师也因为项目受挫离职。复盘了整整2个月,我们排除了所有技术层面的问题:Agent意图识别准确率92%,工具调用成功率94%,RAG检索准确率91%,所有技术指标都达到了合同约定的标准。。
2026-06-01 21:36:58
78
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅