- 博客(13)
- 收藏
- 关注
原创 精读《Harness design for long-running application development》:真正拉开差距的,不是模型本身,而是你怎么给它harness
Anthropic团队在《Harness design for long-running application development》中揭示了AI应用开发的关键洞见:真正决定复杂任务完成质量的不是模型本身,而是为其设计的工作框架(harness)。文章通过前端设计和长时应用开发案例,展示了如何通过拆分任务、建立评价标准和构建闭环系统来解决模型的长程失稳和自我评价失真问题。核心观点包括:将主观任务转化为可评估准则、采用"规划-生成-评估"的三代理架构、以及根据模型能力演进持续优化工作框
2026-03-26 22:05:39
966
原创 Thariq推文【Lessons from Building Claude Code: How We Use Skills 】精读
揭示了 Claude Code 如何将组织经验工程化为可复用的 Agent 能力单元。文章指出,有效的 skill 不是简单的提示词模板,而是包含脚本、数据、流程的"能力目录",覆盖从代码生成到运维的完整交付链路。Anthropic 总结了 9 类实用 skills 和 7 条关键经验,强调应聚焦模型易错点而非重复常识,通过渐进式文件披露和脚本化提升效率。skill 本质上是将隐性组织知识转化为结构化执行单元,既是个人效率工具,更是团队知识分发机制。其价值在于
2026-03-25 19:07:49
526
原创 Thariq推文【Lessons from Building Claude Code Seeing like an Agent】精读
设计模型的工具,既是一门科学,也是一门艺术。我很认同这一点。因为 Agent 系统不是纯静态软件,它面对的是一个会随着模型能力变化而不断迁移的交互对象。今天有效的设计,明天未必仍然最优。多观察输出多实验多调整工具边界多重新审视原来的假设Agent 的工具设计,不该从“我们能接多少能力”开始,而应该从“模型真正能顺畅地用什么能力”开始。这可能才是这篇文章最值得带走的结论。
2026-03-16 10:59:53
546
原创 Thariq推文【Lessons from Building Claude Code: Prompt Caching Is Everything】精读
摘要:文章探讨了Prompt Caching在Agent系统设计中的核心地位,指出其不仅是优化手段,更是决定产品形态的基础设施。通过Claude Code的实践案例,揭示了5个关键设计原则:1) 按稳定性分层组织Prompt结构;2) 用消息而非修改System Prompt传递变化;3) 避免会话中途切换模型;4) 保持工具集稳定;5) 上下文压缩需保持前缀复用。这些原则表明,Agent设计需同时考虑语义逻辑和缓存稳定性,将可缓存性作为系统级约束条件。文章强调,在长会话、多工具场景下,缓存命中率直接影响产
2026-03-13 20:25:21
728
原创 schoober-ai-sdk:大模型信息持久化与断点续传
schoober-ai-sdk设计了支持断点续传的Agent任务持久化机制,核心包含三类数据:任务运行时状态(TaskState)、LLM对话历史(ApiMessage[])和UI消息(UserMessage[])。通过PersistenceManager抽象存储层,支持灵活选择后端实现。StateManager采用防抖策略优化高频状态更新,先更新内存再异步持久化,结合debounce(默认1秒)和maxWait(默认5秒)平衡实时性与IO开销。设计上允许部分数据不一致,优先保证任务可恢
2026-03-08 14:25:49
430
原创 schoober-ai-sdk:设计动态 Prompt 构建
动态 Prompt 构建技术解析 本文介绍了 Agent 框架中动态 prompt 构建的核心机制,主要包含两个关键部分: 双 prompt 注入系统: systemPrompt(系统角色定义)作为 system 消息注入 environmentPrompt(实时上下文)作为末尾 user 消息注入 这种分离设计考虑了缓存优化和语义区分 systemPrompt 的四层组合结构: 基础角色定义和核心行为规范 动态生成的角色提示词(响应任务状态) 工具定义转换(Zod Schema→可读文本) 子 Agent
2026-03-07 10:06:39
375
原创 schoober-ai-sdk: 多 Agent 子任务编排设计
多Agent子任务编排系统 本文介绍了一个基于父子任务机制的多Agent协作系统,通过schoober-ai-sdk实现。系统允许主Agent作为协调者,将复杂任务分解并委派给专业子Agent处理。核心架构包括: 分层结构:主Agent负责协调,子Agent专注特定领域 异步任务机制:通过NewTaskTool创建子任务,主任务暂停等待结果 独立运行环境:每个子Agent拥有独立的配置和工具集 状态管理:SubTaskManager负责父子任务状态转换和关系维护 系统通过注册子Agent、创建异步子任务、管
2026-03-07 00:13:59
502
原创 schoober-ai-sdk:ai Agent工具系统设计理念
本文介绍了工具系统设计的关键要素,重点围绕LLM与工具的协作机制展开。工具系统通过三个核心问题定义其架构:工具定义、执行和管理。工具接口(Tool)作为核心契约,包含名称、描述、参数和执行逻辑等关键方法。设计亮点包括:异步获取工具描述以适应动态场景,使用Zod Schema实现类型与校验统一,以及分离工具结果与状态的双通道机制。BaseTool作为抽象基类,实现了工具状态机管理、流式参数解析(isPartial)和状态合并等高级功能。工具注册采用工厂模式,支持灵活实例化。整体设计兼顾了LLM推理需求和用户体
2026-03-06 19:38:19
633
原创 schoober-ai-sdk:核心ReAct 引擎的实现
本文介绍了 Schoober AI SDK 中 ReAct 引擎的实现细节。ReAct 模式通过推理(Reason)、行动(Act)和观察(Observe)的循环让 LLM 完成任务。核心模块包括驱动循环的 ReActEngine、处理流式响应的 ExecutionManager 和错误追踪的 ErrorTracker。文章详细解析了循环控制、动态提示词生成、流式响应处理、工具并行执行等关键技术点,并介绍了防止 LLM 空转的提醒机制和硬性阈值等兜底策略。该实现注重状态一致性、实时性处理和错误恢复能力。
2026-03-06 17:04:02
955
原创 如何让自己的Agent支持skills功能(纯干货)
上一篇写了自己的原生agent如何实现的mcp,这篇文章说说怎么实现的skills。其实skills比mcp实现起来要简单很多,因为他本质是渐进式披露加载文件系统,然后让大模型去执行skill,也是需要初始化skills获取元数据,
2026-01-21 21:59:21
1523
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1