自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小程故事多的博客

2006-2025从事了19年软件开发,架构和技术管理 腾讯云TVP,腾讯云架构师同盟理事,华为云HCDE专家,阿里云MVP,前极客时间每日一课出品人,出版图书:《高可用可伸缩微服务架构》《深入分布式缓存》《Spring5设计模式》

  • 博客(608)
  • 收藏
  • 关注

原创 从推理到智能体,大模型强化学习中信用分配机制的演进与突破

摘要: 随着大语言模型(LLM)与强化学习(RL)深度融合,信用分配问题成为关键挑战。早期LLM-RL(如RLHF、DPO)采用粗放的整段奖励分配,适用于短文本任务。而推理型RL(如数学推理、代码生成)需将终端二元奖励精准分配至长轨迹的每一步,解决“哪一步决定最终结果”的问题。更复杂的Agent RL(如多轮交互任务)进一步升级难度,需在多轮随机环境中定位关键决策点,处理稀疏延迟奖励。信用分配机制从隐式到显式、从粗放到精细的演进,成为区分推理RL与Agent RL的核心标志,也是实现复杂任务自主决策的关键瓶

2026-04-18 14:07:54 111

原创 Agent总跑偏?从Prompt到Harness,彻底搞懂AI执行稳定的核心逻辑

AI Agent开发中常见的执行跑偏问题,其根源在于工程化设计的不足。文章提出三层逐级扩展的"防护圈"解决方案:Prompt Engineering(指令表达优化)、Context Engineering(上下文信息管理)和Harness Engineering(系统约束设计)。这三层分别解决模型理解、信息获取和长期稳定执行的问题,共同构成AI Agent稳定运行的完整体系。其中Prompt Engineering确保初始指令清晰,Context Engineering保障执行过程中获取

2026-04-18 13:58:29 110

原创 Hermes Agent 架构深度解析,三层骨架六系统,解锁AI智能体的工程化落地密码

《智能体框架的困境与突破:Hermes Agent如何实现真正成长》 当前主流AI智能体框架普遍存在"无状态"缺陷,导致三大痛点:缺乏经验积累、无自检能力和上下文管理混乱。Hermes Agent通过创新设计解决了这些问题,其架构包含三层骨架(感知、决策、执行)和六个系统(消息触发、周期提示、后台复盘等),实现了三大突破:1)动态决策能力,支持任务拆解与实时调整;2)异步学习机制,通过后台复盘实现自主优化;3)双存储记忆系统,兼顾响应速度与知识持久化。这种"与用户共同成长&qu

2026-04-18 11:25:09 45

原创 Spec研发平台实践,从Vibe Coding到范式编程,打造AI领域专家

本文围绕淘系交易场景的AI编程痛点,探索了从“Vibe Coding”到“范式编程”的技术演进路径,核心是通过规范驱动开发(SDD),构建Spec平台,实现AI编程的规范化、标准化和高效化。通过Spec工具选型、CodeAgent双通道部署、领域知识构建和质量评估体系建设,我们解决了AI编程的上下文缺失、知识碎片化、重复造轮子等核心痛点,在小需求开发场景中实现了研发效率和代码质量的双重提升。

2026-04-18 10:06:11 206

原创 深度拆解Hermes Agent,动态Prompt与Learning Loop架构的底层逻辑

除了周期性的Learning Loop,Hermes还有一个特殊的复盘机制,Pre-reset Flush(重置前刷新),用来解决“会话上下文丢失导致经验遗漏”的问题。在网关场景下,用户可能在Telegram、微信、Slack等平台进行长时间对话,而这些平台的会话可能会因为长时间不活跃、每日重置等原因被清空,会话上下文一旦清空,里面的有价值信息(比如用户新的偏好、新的工作方法)就可能被遗漏,无法沉淀到Memory或Skill中。

2026-04-17 13:28:56 740

原创 Agent为何偏爱CLI而非重新发明新接口?深度解析背后的底层逻辑

摘要:AI Agent为何回归CLI命令行界面? AI Agent技术虽高度发达,却普遍采用传统的CLI命令行界面,核心原因在于CLI完美契合AI的任务处理逻辑: Unix管道哲学:1973年诞生的Unix管道设计(文本流输入输出+退出码)天然适配Agent的工作模式,支持命令自由组合与错误快速判断,实现复杂任务的拆解与串联。 接口本质需求:历经SOAP、REST、GraphQL等接口迭代,过度复杂化的设计反而背离了"简单通用、可组合"的核心诉求,而CLI始终保持最小化契约,降低AI的解

2026-04-17 10:52:15 390

原创 破局AI Agent落地困境,Harness六大组件全解析与实践启示

AI Agent的核心突破:从模型优化到Harness工程 当前AI Agent发展面临关键瓶颈——过度聚焦模型能力提升却忽视工程基础设施。本文揭示Agent能力公式Agent=Model+Harness,指出Harness作为工程框架的六大核心组件如何突破模型固有局限: 文件系统:构建持久化工作空间,实现任务状态保存和跨会话协作 Bash+沙箱:赋予行动能力,通过安全环境执行代码形成"生成-执行-验证"闭环 记忆系统:通过AGENTS.md文件实现零成本知识积累,解决模型失忆问题 We

2026-04-17 10:25:10 422

原创 Agent = LLM + Harness,揭开下一代智能体的底层架构真相

Skills是用户自定义能力,可复用的提示词模板,教会Agent新的技能。比如一个Skill可以教Agent如何按照团队规范写代码评审。Skills不涉及代码执行,只是结构化的上下文注入。Skill的物理形态是一个目录,一个文件,支持多源并行加载,五路竞速。Skill通过注册,解析机制变成Command,内置Skills编译进二进制,提供专业知识。条件激活通过文件路径触发Skills,动态发现运行中找到新Skills。

2026-04-16 18:30:58 352

原创 从基础Agent到复杂工作流,LangGraph如何用状态机重构智能体开发

摘要: LangGraph作为新一代智能体开发框架,通过状态机和有向无环图解决了传统Agent的四大痛点:流程不可控、状态管理缺失、多角色协作困难及分支循环能力薄弱。其核心架构包含状态(State)与节点(Node),状态作为共享数据中心实现跨节点数据传递,节点则封装独立业务逻辑。开发者可通过定义结构化状态和功能节点,构建如"调研→撰写→校对"的线性工作流,实现精准流程控制。LangGraph支持复杂条件分支、循环迭代和多智能体协作,显著提升了任务完成率和系统可维护性,为复杂业务场景下的

2026-04-16 14:06:46 588

原创 一文搞懂Hermes,新顶流Agent如何从经验中自我进化

Hermes Agent通过Skills闭环系统实现AI自我进化,其核心在于7个关键阶段:触发创建、安全验证、索引构建、条件激活、渐进式加载、上下文注入和自动改进。该系统让AI像人类专家一样积累经验,将成功流程提炼为可复用的"技能文档",并在使用中持续优化。创建阶段需通过7道安全关卡,包括名称验证、分类验证、格式检查等,并采用原子写入机制确保可靠性。Skill文件采用标准Markdown格式,包含YAML头部元数据和详细步骤说明。这种闭环学习机制使Hermes能够跨会话积累知识,避免重复

2026-04-16 11:23:36 512

原创 颠覆传统开发!Calicat+Claude Code,打通日志分析平台全流程开发

摘要:AI全链路开发日志分析平台实践 本文介绍了如何通过AI工具链在一天内完成日志分析平台从原型到可运行系统的开发。项目采用Calicat原型设计工具与Claude Code等AI编程工具协同工作,实现了需求自动传递、架构设计、代码生成的全流程自动化。重点展示了OpenSpec框架如何将原型转化为标准化项目文档,以及Superpowers工具对技术方案的优化能力。该实践验证了AI在需求理解(准确率达92%)、代码生成(完成度85%)、自审优化等方面的有效性,为开发者提供了可复用的AI驱动开发方法论,将传统数

2026-04-15 14:14:06 388

原创 CLI+Skill打造浏览器AI自动化框架,彻底解放双手告别重复任务

摘要 本文介绍了一种基于Playwright CLI和Skill架构的AI浏览器自动化方案,旨在解决传统自动化工具TOKEN消耗高、操作门槛高、无法复用工作流等痛点。该方案通过轻量级命令行工具Playwright CLI实现按需加载网页信息,配合Skill技能库固化操作流程,可大幅降低AI任务执行成本,甚至实现0TOKEN的固定脚本自动化。文章详细讲解了工具原理、环境搭建步骤、基础命令使用、AI接入方法,并以电商评论抓取为例展示了从AI试错到Skill固化的全流程。该方案具有高效、低成本、易上手等特点,适用

2026-04-15 13:35:39 370

原创 AI-First不是“用AI写代码”,而是重构软件工程的底层逻辑

文章摘要: CREAO联合创始人Peter Pang的文章《Why Your "AI-First" Strategy Is Probably Wrong》揭示,AI-First的核心并非单纯依赖AI生成代码,而是重构工程体系,实现“系统约束AI”。真正的突破在于将需求、测试、发布等环节改造为AI可读、可执行的自动化链路,形成自愈反馈闭环。关键要素包括:可见性(系统状态对AI透明)、确定性(流程标准化)、可观测性(结构化日志)和反馈自动化(闭环优化)。Peter Pang指出,多数团队仅停

2026-04-15 09:01:44 463

原创 从OpenClaw看AI Agent架构设计,三大工程理念解锁可控高效智能助手

手动触发:用户可通过/compact命令显式要求压缩,并可指定保留的关键信息,比如/compact 请特别保留关于项目架构的讨论内容,确保核心信息不被遗漏。自动触发:这是系统默认行为,系统会实时监控Token用量,设定一个水位线,当当前Token用量超过“上下文窗口大小 - 预留空间”时自动触发。

2026-04-14 16:13:33 483

原创 告别无效代码阅读,AI编码效率革命,code-review-graph让Claude精准读懂你的项目

AI辅助编程工具面临重复读取代码库导致效率低下的痛点。开源工具code-review-graph通过构建代码结构图谱,实现增量更新与精准上下文定位,大幅降低Token消耗和响应时间。测试显示,在代码审查场景平均减少6.8倍Token,大型项目实时编码场景最高减少49倍Token。该工具支持12种编程语言,具备自动化更新、爆炸半径分析等功能,数据本地存储确保安全。安装简单,仅需两步即可集成到Claude Code中,显著提升AI编码效率,尤其适合大型项目和单体仓库。

2026-04-14 13:21:00 651

原创 Agent+Milvus,告别静态知识库,打造具备动态记忆的智能AI助手

文章摘要: 本文探讨了AI助手记忆系统的技术演进路径,从传统RAG架构到动态记忆管理。传统RAG存在知识库无法实时更新、强制检索浪费资源、缺乏个性化记忆三大痛点。作者提出使用Milvus向量数据库实现动态记忆系统,详细解析了RAG的工作原理和技术难点,重点介绍了如何通过Milvus实现毫秒级检索。文章包含具体代码示例,展示从文档向量化、批量插入到在线检索的完整流程,为开发者构建具备长期记忆能力的AI助手提供了实用方案。

2026-04-14 09:10:26 473

原创 Tool Harness,让AI Agent的工具调用从“能用”到“可靠”,落地生产的关键一步

AI Agent工具调用从Demo到生产面临的核心挑战是可靠性问题。文章指出,单纯实现工具调用功能只是第一步,真正落地需要构建"Tool Harness"(工具治理层)来解决四大核心痛点:1)工具选择问题,确保调用正确的工具;2)调用规范问题,处理参数传递和前置条件;3)结果处理问题,验证返回结果的可靠性;4)风险控制问题,分级管理不同风险等级的工具操作。作者强调,生产环境中最大的风险不是接口设计问题,而是系统行为层面的问题,如工具超时未处理、错误结果继续执行等。要真正实现AI Agen

2026-04-14 06:55:17 336

原创 一路狂揽4.8万星!Hermes Agent绝非OpenClaw平替,而是AI助手的进化新方向

摘要: 开源AI Agent框架Hermes Agent近期火爆GitHub,累计获4.8万星,挑战OpenClaw的领先地位。其核心优势在于“学习能力”而非单纯执行任务:内置闭合学习循环,可自动复盘任务并生成可复用的Skill文件,支持跨平台兼容。相比OpenClaw的静态记忆,Hermes创新设计四层记忆系统(常驻提示、会话归档、技能文件、临时缓存),解决AI“记不住、记不准”痛点,实现“越用越懂用户”。团队快速迭代、响应社区需求,兼容多系统,支持Claude及自研模型,成为开发者与普通用户的高效智能搭

2026-04-13 14:43:58 700

原创 揭秘大模型“说话”核心,下一字预测的底层逻辑,看完秒懂AI创作原理

摘要: 大模型生成文本的核心机制是多模块协同的概率预测闭环。首先通过训练学习语义关联规律,形成预测基础;随后在生成时,解码器加工语义、线性层映射维度、Softmax函数转换概率,逐字迭代输出。掩码自注意力确保上下文逻辑连贯,交叉注意力紧扣问题防止跑题。整个过程并非简单匹配相似词,而是动态计算每个字的出现概率,从而生成既符合逻辑又贴合需求的文本。这种“概率推理”能力使大模型能创造新内容,而非仅复现既有搭配。

2026-04-13 14:34:45 340

原创 别再把PDF直接扔进RAG了,这个GitHub爆火项目,把表格、阅读顺序和引用坐标一次性搞定

OpenDataLoader PDF:专为RAG设计的PDF解析利器 摘要: PDF解析已成为RAG项目的关键瓶颈,传统工具在多栏排版、表格处理、引用定位等方面存在严重缺陷。OpenDataLoader PDF针对性地解决了这些问题:1)提供带坐标的结构化数据输出,实现精准引用回链;2)采用XY-Cut++算法确保阅读顺序正确;3)本地CPU优先+混合模式兼顾效率与成本。该项目还具备表格抽取、标题层级检测、OCR支持等实用功能,并特别关注数据安全和合规需求。其GitHub快速破万星的表现印证了其在RAG场景

2026-04-13 11:10:22 482

原创 从输入到输出,Transformer完整拆解,零基础也能看懂的大模型核心逻辑

本文用通俗易懂的方式拆解Transformer的核心原理和工作流程。Transformer由编码器(理解输入)和解码器(生成输出)组成,通过6层结构处理文本数据。编码器先将文字转换为数字向量(词嵌入+位置编码),再经过多头注意力机制(从8个角度分析字词关系)和前馈神经网络(深度加工语义特征)处理,配合残差连接和层归一化保证训练稳定性。解码器类似但增加了掩码机制,逐步生成输出结果。整个过程通过数字向量变换实现"理解-生成"功能,6层结构平衡了模型深度与计算效率。文章还提供了PyTorch代

2026-04-12 20:03:02 334

原创 从Claude Code源码泄露,读懂12个可复用的Agentic Harness设计模式(生产级落地指南)

Claude Code源码泄露揭示12个生产级Agent设计模式,分为记忆与上下文、工作流与编排、工具与权限、自动化四大类。文章重点解析了5个记忆与上下文优化模式:持久化指令文件避免重复规则输入,作用域上下文组装实现规则动态加载,分层记忆按需调取关键信息,记忆整合自动清理冗余数据,渐进式上下文压缩解决长对话记忆问题。这些模式解决了AI编码助手"记不住、记太乱、记太多"的核心痛点,通过系统化架构设计平衡记忆效率与Token消耗。每种模式都包含具体实现方法、适用场景和潜在权衡,为Agent开

2026-04-12 17:23:19 375

原创 碾压普通 AI 编程,Karpathy 提炼的 CLAUDE.md 指南,让 LLM 秒变工程师

摘要 AI编程助手在提升开发效率的同时,也暴露出过度复杂化、擅自修改无关代码、隐藏关键假设、缺乏验证等痛点。开源项目andrej-karpathy-skills通过CLAUDE.md指南提出四大优化原则:1)先思考再编码,澄清需求歧义;2)追求代码简洁,避免冗余设计;3)精准修改代码,保持风格统一;4)目标驱动开发,建立验证闭环。该指南可通过直接调用或插件安装方式落地应用,将AI从"添乱新手"转变为"靠谱工程师",实现高效人机协作。这些原则直击AI编程核心痛点,为开发

2026-04-12 09:15:17 539

原创 Harness Engineering,给 Coding Agent 套上 “缰绳”,搞定千万 Token 级长程任务

本文探讨了AI Coding Agent在执行大规模长程任务时面临的三大核心挑战:上下文耗尽导致信息丢失、中断后无法恢复进度以及规模放大后行为不可控。针对这些问题,文章提出了四个关键设计原则:任务拆解(将大任务分解为合理粒度的子任务)、并行执行(通过并发提升效率)、可续传机制(状态持久化实现断点续传)以及明确完成条件(确保结果可验证)。这些原则共同构成了"Harness Engineering"框架,旨在为AI Agent套上"缰绳",使其能够可靠地处理涉及上千文件、

2026-04-12 08:39:06 568

原创 从零吃透Transformer核心,多头注意力、残差连接与前馈网络(大白话完整版)

Transformer是大模型的核心架构,其核心模块包括多头注意力、残差连接和前馈网络。本文用通俗易懂的方式解析这些复杂概念: 多头注意力:让模型从多个角度分析词间关系,类似多个翻译员分工协作。核心公式拆解为四步:准备Q/K/V矩阵、分配权重、独立计算、汇总结果。 残差连接与层归一化:防止信息丢失,像备忘录一样保留原始输入,并通过归一化稳定训练过程。 前馈网络:对注意力结果进一步加工,增强模型表达能力。 通过生活化类比和步骤拆解,帮助读者彻底理解Transformer的工作原理,摆脱学习障碍。

2026-04-11 20:59:50 360

原创 彻底搞懂Transformer中的QKV矩阵 从来历到作用的通俗解析

本文用通俗易懂的方式解析Transformer模型中QKV矩阵的核心原理。首先指出简化版自注意力机制的致命缺陷——缺乏可训练参数,导致模型无法动态调整注意力分配。随后详细讲解QKV矩阵的生成过程:通过输入矩阵X分别与可训练权重矩阵Wq、Wk、Wv相乘,得到查询(Q)、键(K)、值(V)三个矩阵。文章采用"图书馆找书"的生活化类比:Q代表查询需求(找什么),K对应检索匹配(有什么),V存储实际内容(得到什么)。这种分工使Transformer能动态学习不同任务的最优注意力模式,从而获得强大

2026-04-11 16:43:53 352

原创 Claude Managed Agents横空出世,AI Agent开发的革命,多少项目要被淘汰?

AI Agent开发迎来变革:Claude Managed Agents简化生产级部署 Anthropic推出的Claude Managed Agents正颠覆AI Agent开发领域,解决了生产级部署的核心痛点。传统AI Agent开发中,开发者需耗费大量时间搭建安全沙箱、状态管理、权限控制等基础设施模块,这些与核心业务无关却必不可少的工作严重拖慢开发进度。Claude Managed Agents将这些基础设施全部托管,提供包括托管框架、安全沙箱、状态管理、凭证保险箱、错误恢复和持续运行等六大核心功能,

2026-04-11 11:13:51 521

原创 从零搞懂Transformer,从位置编码到自注意力,大模型的核心逻辑全拆解

Transformer模型是当前AI大模型的核心架构,其核心创新在于位置编码和编码器-解码器结构。位置编码通过正弦余弦函数为每个字赋予位置信息,解决了传统模型无法理解文字顺序的问题。模型采用编码器-解码器架构,编码器负责理解输入文本,解码器则逐字生成输出结果。训练过程中使用Pad Mask处理不同长度句子,Sequence Mask防止解码器"偷看"未生成内容。最终通过线性层和Softmax函数将内部表示转换为可读输出。该架构使AI能有效理解语义关系,成为现代自然语言处理的基础。

2026-04-11 10:56:00 397

原创 AI Coding 工程化革命,Superpowers 管流程,ui-ux-pro-max 管质感

Superpowers和ui-ux-pro-max的真正价值,不在于它们能把AI变成“全自动高级工程师”,而在于它们分别补上了两个最常见的缺口,一个补流程,一个补设计。前者让任务不那么容易一路失控,后者让前端结果不那么容易停留在“有组件,但没产品感”的层面。它们不是所有项目都需要的东西,也不是装完就一定立刻见效的东西。你还是得判断任务值不值得走完整流程,还是得亲自做关键决策,还是得面对代码基线、团队习惯和项目复杂度这些很现实的问题。最后别只停留在“看”的层面,亲自去试一试。

2026-04-10 18:30:00 437

原创 吃透AgentFlow,一文读懂LangGraph 11种多智能体设计模式

多智能体协作已成为AI解决复杂任务的关键方案,但架构设计是最大难点。AgentFlow基于LangGraph框架,提供了11种经过验证的多智能体设计模式,包括Reflection迭代优化、Debate多视角辩论、MapReduce并行处理等。这些模式覆盖从自我优化到安全管控的全场景,支持单独使用或灵活组合。项目提供完整代码示例和架构图,开发者可快速部署实践。未来多智能体设计将向轻量化、自适应方向发展,AgentFlow将持续更新为开发者提供参考。

2026-04-10 18:00:00 175

原创 Agent Runtime,解锁AI智能体生产级运行的核心密钥

AI智能体在生产环境落地面临稳定性差、状态丢失等挑战,Agent Runtime成为关键基础设施。文章对比了三大主流工具:LangGraph采用图结构设计,支持断点续跑和人机协作;Temporal基于20年技术积累,确保工作流100%完成;Inngest主打无运维事件驱动。三者各具优势:LangGraph适合AI原生场景但学习曲线陡峭,Temporal可靠性强但部署复杂,Inngest平衡易用性与可靠性。企业应根据团队规模、技术栈和运维能力选择适合方案,LangGraph适合深度AI团队,Temporal满

2026-04-10 09:28:27 491

原创 面向2026,AI Agent Harness 最小化设计指南与实践思考

摘要: 2026年AI Agent领域最热概念“Harness”被广泛讨论但普遍误解。Harness并非复杂功能的堆砌,而是支撑AI Agent稳定运行的极简底层底座,本质是衔接大模型与实际任务的软件外壳。其设计需遵循“少即是多”原则,避免与未来模型能力冲突。核心组件包括:简洁的Agent Loop循环、Context记忆管理、原子化工具等。开发者应区分核心与辅助组件,聚焦适配模型迭代的最小化设计,而非盲目堆砌技术债。Harness的终极目标是让模型“落地做事”,而非成为功能容器。

2026-04-10 09:06:13 538

原创 AI时代编程,告别“手搓焦虑”,从敲码工到系统设计者的进化之路

作为一名计算机科学专业的学生,你正处在一个技术变革速度远超以往的时代。从曾经只能依靠手动逐行编写代码、反复调试排错的传统开发模式,到如今Cursor、OpenCode、Claude Code等AI编码工具遍地开花,再到智能Agent自动完成项目搭建、逻辑实现、错误修复的全流程开发,编程的门槛似乎在不断降低,代码编写这件事也变得越来越轻松。你坦言自己的日常作业、期末大作业几乎都依赖AI完成,学校没有严格的笔试要求,也很少有必须手动编写代码的场景,久而久之便养成了依赖工具的习惯。

2026-04-09 16:52:40 284

原创 出厂自带“缰绳”的AI来了,Hermes Agent正在重新定义智能体

Hermes Agent的出现,标志着AI智能体进入了新的阶段。从手动配置、人工维护的传统工具,到自动学习、自我进化的新型智能体,门槛大幅降低,普通人也能拥有属于自己的、越用越好用的私人AI助手。它不用你写复杂的配置文件,不用你手动维护规则,部署后只要正常使用,它就会慢慢成长,记住你的习惯、优化自己的能力、适配你的需求,像一个真正的伙伴一样陪伴你工作。对于开发者,它是24小时值守的自动化管家,解放重复劳动;对于内容创作者,它是懂风格、会进化的专属编辑;对于普通用户,它是低成本、高隐私的私人智能助手。

2026-04-09 13:55:15 506

原创 从Claude Code到Codex,AI Agent的两种驯化哲学,谁才是工程落地的正解

本文对比了Claude Code和Codex两套AI Coding Agent架构的核心差异,指出其本质区别在于Harness(约束系统)的设计理念。Claude Code采用动态prompt装配线和运行时主循环,强调现场适应性和快速响应;Codex则构建结构化公文系统和线程状态管理,注重规范化和可追溯性。在工具调用方面,前者依靠运行时审批,后者采用策略引擎约束。本地治理上,Claude Code通过记忆收编快速适配,Codex则通过结构化资产规范管理。两种架构分别体现了"灵活应变"和&

2026-04-09 09:42:26 906

原创 从源码拆解Agent Skills与Function Calling,底层实现、核心差异与实操指南

摘要: 2026年Claude Code源码泄露揭示了Agent Skills与Function Calling的本质差异。Function Calling是原子化工具执行框架,通过结构化接口(Tool)实现严格校验与七步闭环流程,适用于单步操作。而Skills实为提示词注入器(PromptCommand),通过SkillTool适配器将动态生成的指令(SKILL.md模板)注入模型上下文,实现流程编排与执行控制。两者协作模式上,Function Calling是Agent的“手脚”,Skills则是“大脑

2026-04-09 09:34:55 480

原创 破局 AI 编码乱象:SDD 规范驱动 + OpenSpec+SuperPowers 双框架,让 AI 写对每一行可追溯代码

摘要: 规范驱动开发(SDD)通过“先规范后编码”的闭环工作流(需求→规范→代码→验证)解决传统AI编码的痛点(需求偏差、技术债积累)。核心框架OpenSpec以结构化Artifact链(提案、设计、规格、任务)确保变更可追溯,通过命令行工具(如/opsx:ff)快速生成规范文档并约束AI实现代码,适用于需长期维护的项目。案例演示了从需求到落地的全流程,强调SDD能提升AI编码的精准性与可维护性,避免效率假象。(149字)

2026-04-08 13:43:29 590

原创 工具并行的极致工程,Claude Code 流式工具执行器深度解析

摘要: 传统AI智能体工具调用存在明显的串行执行瓶颈,导致用户感知延迟高。Claude Code通过530行的StreamingToolExecutor组件创新性地实现了流式工具执行,模仿人类程序员思考与行动同步的工作模式。该组件基于SSE流式API的事件驱动机制,在模型生成内容的同时并行执行工具调用,将传统模式下必须串行等待的时间完全重叠消弭。技术实现上采用状态机设计,通过pendingBlocks和runningTools两个核心状态集合动态调度工具执行,并引入并发安全机制区分只读/写操作工具。测试显示

2026-04-08 11:14:58 435

原创 拆解Superpowers,给Claude Code装上“顶级SOP”,让AI开发告别混乱

AI辅助开发常因缺乏规范导致效率低下,Superpowers通过14个标准化Skill文件构建四层约束框架,强制规范AI开发流程。该方案无需复杂安装,只需在项目skills/目录添加自然语言规则文档即可生效。从需求对齐、任务拆分到隔离开发、测试验证,形成严格的开发闭环,有效解决AI盲目修改、缺乏验证等痛点。通过将程序员经验固化为可执行规则,使AI开发从"混乱无序"转变为"规范高效",真正实现技术提效。

2026-04-08 09:22:10 799

原创 28K Token看似够用?深度拆解Claude Code四层上下文压缩,看懂AI编程的真正瓶颈

大模型编程助手的上下文窗口管理:从理论到实践的挑战 摘要: 随着AI编程助手的发展,上下文窗口大小成为衡量产品能力的核心指标。然而,在实际工程应用中,即使128K的超大窗口也会迅速耗尽。本文以Claude Code为例,揭示了其四层上下文压缩策略如何解决这一难题:1)HISTORY_SNIP裁剪工具输出噪声;2)CACHED_MICROCOMPACT通过缓存摘要压缩早期对话;3)CONTEXT_COLLAPSE结构化归档关键决策;4)REACTIVE_COMPACT实现无感知自动压缩。这些策略在不丢失核心信

2026-04-07 16:30:49 536

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除