Claw开发者-CSDN博客

原创 Hermes 接 LiteLLM 缓存不生效踩坑记录

Hermes Agent 接 LiteLLM 网关时，因 provider: custom 未显式指定 api_mode，默认走 OpenAI 兼容协议，导致 Prompt Cache 缓存字段从未发送，命中率为 0%。本文记录排查过程、根因分析（api_mode 自动推断逻辑）及修复方法：加一行 api_mode: anthropic_messages，将请求协议从 OpenAI SDK 切换到 Anthropic SDK，缓存命中率从 0% 升至约 95%，单次请求成本下降约 73%。

2026-04-27 13:14:59 486

原创 Anthropic发布神话模型Mythos，却不让你用

因为它太强了——强到能自主发现并利用藏了 27 年的系统漏洞。这个模型叫（"神话"预览版）。不是因为它不够好。恰恰相反，是因为它好得让 Anthropic 自己都害怕了。

2026-04-26 12:02:12 502

原创两个问题花了一块四：AI Agent 的使用成本到底有多离谱？

两个问题，一块四。一天工作，三千多。这就是 2026 年春天，一个独立开发者使用 AI Agent 的真实成本。贵吗？看跟什么比。跟人力成本比，已经到了同一量级。跟 AI 创造的效率提升比——如果它真的让你一个人干了三个人的活——那可能还是划算的。但"划算"的前提是，你得学会怎么花这些 Token。Token 预算管理。这不是开玩笑。在可预见的未来，"Token 使用效率"可能会成为衡量工程团队能力的新指标。谁能用更少的 Token 完成同样质量的工作，谁就有竞争优势。

2026-04-25 21:51:26 457

原创让 AI Coding Agent 真正理解你的代码库：分层上下文工程实践

做法Token 消耗准确性维护成本❌ 让 Agent 每次自己探索高低（靠猜）零⚠️ 单一大 CLAUDE.md中（全量加载）中低✅ 分层按需加载低（只加载相关的）高（人写的精确描述）中（需同步维护）顶层极简：根目录只放索引和全局规则，50 行以内详情下沉：每个子项目维护自己的上下文文件，按需加载代码改了文档也改：同步规则写进不变量，让 Agent 自觉维护。

2026-04-25 20:19:22 441

原创第5课：按需加载领域知识——Skill机制

10个Skill每个2000 token就是20000 token，大部分跟当前任务无关。两层注入架构让Agent只在需要时才加载对应知识。用40行Python实现Claude Code的Skill加载机制。

2026-04-19 10:06:27 453

原创第4课：Subagent —— 拆解大任务，上下文隔离

父Agent把大任务拆成子任务，每个子任务用独立上下文执行，只有最终结果返回。用30行Python实现Claude Code的子Agent隔离机制。

2026-04-18 10:15:03 381

原创第3课：TodoWrite —— 让Agent先想后做：规划系统

多步任务中模型会丢失进度、跳步、跑偏。TodoManager 用一个带状态的待办列表 + nag reminder，让 Agent 从"走哪算哪"变成"按计划推进"。

2026-04-17 11:47:08 401

转载 Opus 4.7 + Claude Code 最佳实践

Anthropic 官方博客解读：Opus 4.7 引入自适应思考、xhigh 努力等级、更精准的响应长度校准，本文详解升级要点和实战配置建议。

2026-04-17 09:25:47 300

原创第2课：给Agent加工具 —— dispatch map模式详解

从1个Bash工具扩展到4个专用工具，核心是一个dispatch map字典。新增工具只需注册一个handler，循环一行不改。

2026-04-16 10:16:54 382

原创第1课：用20行Python造出你的第一个AI Agent

关键参数是tools。你告诉模型 “你有一个叫 bash 的工具，可以执行 shell 命令”，模型就知道自己有了一双手。TOOLS = [{},}]一个名字，一段描述，一个参数定义。这就是给模型的 “工具说明书”。模型读懂之后，就知道怎么调用这个工具了。组件之前之后Agent 循环无while True工具无bash（单一工具）消息管理无累积式消息列表退出机制无代码量0~120 行（含安全防护和交互界面）能感知环境（通过 bash 读取文件、查看状态）能行动。

2026-04-14 20:32:12 354