自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Hermes 接 LiteLLM 缓存不生效踩坑记录

Hermes Agent 接 LiteLLM 网关时,因 provider: custom 未显式指定 api_mode,默认走 OpenAI 兼容协议,导致 Prompt Cache 缓存字段从未发送,命中率为 0%。本文记录排查过程、根因分析(api_mode 自动推断逻辑)及修复方法:加一行 api_mode: anthropic_messages,将请求协议从 OpenAI SDK 切换到 Anthropic SDK,缓存命中率从 0% 升至约 95%,单次请求成本下降约 73%。

2026-04-27 13:14:59 486

原创 Anthropic发布神话模型Mythos,却不让你用

因为它太强了——强到能自主发现并利用藏了 27 年的系统漏洞。这个模型叫("神话"预览版)。不是因为它不够好。恰恰相反,是因为它好得让 Anthropic 自己都害怕了。

2026-04-26 12:02:12 502

原创 两个问题花了一块四:AI Agent 的使用成本到底有多离谱?

两个问题,一块四。一天工作,三千多。这就是 2026 年春天,一个独立开发者使用 AI Agent 的真实成本。贵吗?看跟什么比。跟人力成本比,已经到了同一量级。跟 AI 创造的效率提升比——如果它真的让你一个人干了三个人的活——那可能还是划算的。但"划算"的前提是,你得学会怎么花这些 Token。Token 预算管理。这不是开玩笑。在可预见的未来,"Token 使用效率"可能会成为衡量工程团队能力的新指标。谁能用更少的 Token 完成同样质量的工作,谁就有竞争优势。

2026-04-25 21:51:26 457

原创 让 AI Coding Agent 真正理解你的代码库:分层上下文工程实践

做法Token 消耗准确性维护成本❌ 让 Agent 每次自己探索高低(靠猜)零⚠️ 单一大 CLAUDE.md中(全量加载)中低✅ 分层按需加载低(只加载相关的)高(人写的精确描述)中(需同步维护)顶层极简:根目录只放索引和全局规则,50 行以内详情下沉:每个子项目维护自己的上下文文件,按需加载代码改了文档也改:同步规则写进不变量,让 Agent 自觉维护。

2026-04-25 20:19:22 441

原创 第5课:按需加载领域知识——Skill机制

10个Skill每个2000 token就是20000 token,大部分跟当前任务无关。两层注入架构让Agent只在需要时才加载对应知识。用40行Python实现Claude Code的Skill加载机制。

2026-04-19 10:06:27 453

原创 第4课:Subagent —— 拆解大任务,上下文隔离

父Agent把大任务拆成子任务,每个子任务用独立上下文执行,只有最终结果返回。用30行Python实现Claude Code的子Agent隔离机制。

2026-04-18 10:15:03 381

原创 第3课:TodoWrite —— 让Agent先想后做:规划系统

多步任务中模型会丢失进度、跳步、跑偏。TodoManager 用一个带状态的待办列表 + nag reminder,让 Agent 从"走哪算哪"变成"按计划推进"。

2026-04-17 11:47:08 401

转载 Opus 4.7 + Claude Code 最佳实践

Anthropic 官方博客解读:Opus 4.7 引入自适应思考、xhigh 努力等级、更精准的响应长度校准,本文详解升级要点和实战配置建议。

2026-04-17 09:25:47 300

原创 第2课:给Agent加工具 —— dispatch map模式详解

从1个Bash工具扩展到4个专用工具,核心是一个dispatch map字典。新增工具只需注册一个handler,循环一行不改。

2026-04-16 10:16:54 382

原创 第1课:用20行Python造出你的第一个AI Agent

关键参数是tools。你告诉模型 “你有一个叫 bash 的工具,可以执行 shell 命令”,模型就知道自己有了一双手。TOOLS = [{},}]一个名字,一段描述,一个参数定义。这就是给模型的 “工具说明书”。模型读懂之后,就知道怎么调用这个工具了。组件之前之后Agent 循环无while True工具无bash(单一工具)消息管理无累积式消息列表退出机制无代码量0~120 行(含安全防护和交互界面)能感知环境(通过 bash 读取文件、查看状态)能行动。

2026-04-14 20:32:12 354

原创 第1课:用20行Python造出你的第一个AI Agent

所有AI Agent的秘密就藏在一个while循环里。20行Python代码,让大模型从"只会说"变成"能动手"。这是《12课拆解Claude Code架构》系列的第一课,也是最重要的一课。

2026-04-13 21:07:18 517

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除