Sam0927-CSDN博客

原创 Agent 如何节省 Token 成本：从 Prompt 到工程监控的系统化优化指南

Agent 的 token 成本不只来自模型调用，还来自历史上下文、工具结果、RAG 召回、输出冗余与重试链路。本文从成本来源、上下文预算、模型路由、缓存、摘要压缩、工具结果裁剪、批处理、评测监控等方面，梳理一套可落地的 Agent token 降本方法。

2026-06-08 15:09:47 399 2

原创一文讲清楚 Agent 权限怎么做：从最小权限到提示注入防护

AI Agent 不只是会调用接口的应用，它能理解上下文、组合工具、主动执行任务，因此权限设计必须覆盖工具、数据、网络、文件、消息、交易和系统配置等对象。本文从最小权限、默认拒绝、RBAC/ABAC、动态授权、HITL、沙箱隔离、凭证保护、审计日志和提示注入防护出发，给出一套可落地的 Agent 权限设计清单。

2026-06-04 12:31:08 3089 1

原创 AI 功能里的赞和踩有什么用：反馈数据如何驱动模型优化、产品迭代与安全治理

本文系统讲解 AI 功能中“赞”和“踩”的作用，解析用户反馈如何进入数据采集、问题归因、评测集建设、模型优化、RAG 调优和产品迭代闭环。适合 AI 产品经理、研发团队和运营人员理解反馈数据价值、处理逻辑与常见误区。

2026-06-03 20:51:06 1608 1

原创 OpenClaw vs Hermes Agent：企业级执行 vs 自我进化，一文读懂怎么选！

AI Agent 开源双子星深度对比：OpenClaw（GitHub 26.4w⭐）主打工程化落地，四层记忆+20+渠道+13,700+技能，适合企业自动化；Hermes Agent（53天10w⭐）主打闭环学习，四级记忆+自动技能进化+3,200+社区技能，越用越聪明。两者可互补组合：OpenClaw 做稳定执行引擎，Hermes 做持续学习大脑。短期落地选 OpenClaw，长期陪伴选 Hermes，组合使用才是终极答案！

2026-05-30 12:06:53 1821

原创 OpenClaw 和 Hermes 怎么结合：从聊天入口到隔离执行器的 Agent 工程实践

本文从工程实践角度拆解 OpenClaw 与 Hermes 的组合方式：OpenClaw 负责聊天入口、上下文、权限、任务编排和结果汇总，Hermes 负责隔离执行、命令运行、浏览器验证和复杂任务处理。文章覆盖调用链路、任务派发边界、上下文/凭据/写回控制、Cron 长任务、安全实践和常见坑，帮助开发者把二者组合成可落地、可审计、可停止的 Agent 工程系统。

2026-06-13 16:35:30 191

原创 AI Agent 沙箱怎么做：从文件、网络、工具到权限边界的工程实践

本文系统讲解 AI Agent 沙箱的工程设计方法，覆盖文件系统、网络访问、命令执行、凭据隔离、工具权限、资源配额、人工确认和审计日志等关键边界，帮助开发者把 Agent 从 Demo 推向可控、可追踪、可治理的生产执行环境。

2026-06-13 14:40:18 114

原创大模型 API 智能路由怎么做：模型、供应商、成本与稳定性的工程实践

本文系统讲解大模型 API 智能路由的工程设计方法，覆盖模型、供应商、endpoint、API Key、参数和执行方式等路由对象，并从任务类型、请求规模、质量等级、实时健康状态和业务约束出发，拆解路由架构、评分策略、失败重试、fallback 降级、成本控制、灰度评估和常见坑，帮助团队构建稳定、可解释、可观测的大模型调用网关。

2026-06-12 15:28:27 328 2

原创 AI Agent 记忆怎么做：从短期上下文到长期记忆的工程实践

本文面向 AI Agent 开发者和产品技术团队，系统讲解 Agent 记忆怎么做，覆盖短期上下文、工作记忆、长期记忆、RAG 知识检索、记忆写入与召回、重排压缩、安全边界和审计机制，帮助团队构建可持续协作、可恢复、可治理的生产级 Agent 记忆系统。

2026-06-12 10:11:16 1117

原创给 AI Agent 加可观测性：为什么要打印真实请求体、响应和错误码

AI Agent 能调用工具不等于工程上可用。本文从一次 sequential_image_generation_options.max_images 参数缺失引发的排障说起，介绍 Agent 调外部 API 时应该记录哪些可观测信息：工具选择、输入参数、请求体摘要、状态码、业务错误码、阶段耗时和产物信息，并说明如何在日志脱敏前提下快速定位问题。

2026-06-11 18:53:45 340

原创火山方舟 byted-ark-seedream-skill 组图生成误报 429：根因是缺失 max_images 字段（附修复）

最近将火山方舟 Agent Plan 的 Seedream 视觉模型接入 OpenClaw 时，遇到一个典型但容易误判的问题：单图生成正常，使用官方 Skill byted-ark-seedream-skill 生成组图时，返回 429 AccountRateLimitExceeded。本文提供了解决方法。

2026-06-11 10:41:23 606

原创从推理到纠错：ReAct、CoT 与自反思 Agent 的工程落地

面向 AI Agent 应用开发者、产品经理和架构师，系统拆解 CoT、ReAct 与 Self-Reflection 的作用边界、协同方式和工程落地方法，并结合运维、客服、订单、风控等场景说明如何构建会思考、会行动、会自我修正的 Agent。

2026-06-10 14:26:50 444 1

原创手把手教你写 Skill：从需求定义到可复用工具流程的完整实践

本文面向 AI Agent 使用者和开发者，手把手讲解如何编写一个可复用 Skill，覆盖需求边界、目录结构、SKILL.md 编写、脚本封装、参数设计、错误处理、安全约束、测试验证和迭代维护，帮助团队把一次性操作沉淀为稳定、可复用的自动化能力。

2026-06-10 09:14:17 300

原创评估 Agent 不能只凭感觉：一套可落地的量化指标与验收方法

面向 AI 产品、算法、研发与测试团队，系统梳理 Agent 效果评估从主观体验走向可量化指标的工程方法，包括任务成功率、质量、效率、稳定性、安全性、体验指标、黄金集构建、离线回放、在线灰度与持续监控。

2026-06-09 08:59:16 334

原创 Function Calling 与 MCP：Agent 工程中的工具调用边界与协议选择

本文面向 AI Agent 应用开发者、产品经理与架构师，从工程视角拆解 Function Calling 与 MCP 的核心差异：前者更像模型侧的函数调用契约，适合单应用内工具编排；后者更像 Agent 与外部能力系统之间的上下文协议，适合跨系统、跨团队、可治理的工具生态。

2026-06-09 08:58:26 299

原创 Agent 达到上下文后怎么处理：从滑动窗口到长期记忆的工程实践

Agent 达到上下文窗口上限后，不能简单截断历史，否则容易丢失目标、约束和工具结果。本文系统讲解上下文窗口限制、滑动窗口、摘要压缩、RAG 检索、任务状态外置、工具结果裁剪、分层记忆和降级策略，帮助开发者构建更稳定的长任务 Agent。

2026-06-08 16:09:51 325

原创 RAG 调优实战指南：混合检索、Query 改写、Rerank 与评估指标怎么做

本文面向 RAG 应用调优实践，系统总结混合检索、Query 改写、Rerank、上下文压缩和效果评估方法，帮助 AI 应用开发者提升召回率、答案准确性与可解释性，适合知识库问答、智能客服和企业搜索场景参考。

2026-06-07 14:20:57 355

原创小白也能听懂 Transformer 架构原理：从 Attention 到大模型的入门指南

本文用小白也能听懂的方式讲解 Transformer 架构原理，覆盖 Attention、QKV、Self-Attention、Multi-Head Attention、位置编码、Encoder/Decoder 与大模型关系，适合 AI 初学者、产品经理和研发入门者快速建立知识框架。

2026-06-07 14:18:16 377

原创提示词工程最佳实践：从会提问到可复用、可评估、可落地的 AI 工作流

本文系统讲解提示词工程的本质、结构与最佳实践，强调提示词不是“咒语”，而是通过角色、目标、上下文、步骤、约束、输出格式和失败处理来降低模型不确定性。文章结合 RAG、Agent、工作流等场景，说明如何设计、评估和迭代高质量提示词，让 AI 输出更稳定、可靠、可控。

2026-06-06 16:19:32 217

原创谈谈如何实现 SLA 4 个 9：从可用性指标到稳定性工程落地

实现 SLA 的第一步，不是上高可用架构，而是定义“什么叫可用”。统计的是系统整体，还是某几个核心接口？统计周期是月、季度，还是年？HTTP 5xx 算不可用，那业务失败算不算？延迟超过阈值算不算不可用？计划维护时间是否排除？第三方服务故障是否计入？灰度、测试、压测流量是否纳入统计？如果这些边界没说清楚，SLA 就会变成口号，故障复盘时也很难判断责任和影响。实现 SLA 4 个 9，本质上是把稳定性从“出事后救火”变成“可度量、可治理、可演练、可持续优化”的工程体系。

2026-06-05 20:52:20 216

原创 OpenClaw 指令大全：从入门命令到自动化运维的 CLI 实用指南

本文系统整理 OpenClaw 常用 CLI 指令，覆盖 help/status/gateway/agent/message/channels/cron/skills/models/sessions/tasks/config/nodes/plugins 等命令的使用场景、典型示例和安全注意事项，适合新手快速入门，也适合日常运维和自动化排障时查阅。

2026-06-05 20:51:09 1606

原创 Human-in-the-loop 是什么：让 AI Agent 可控、可靠、可迭代的人机协同实践指南

Human-in-the-loop 的本质，是在人和 AI 之间建立清晰分工：AI 负责高频、重复、可计算的部分，人负责目标判断、风险把关、价值选择和最终责任。对 AI Agent 来说，HITL 应该被当作产品架构的一部分，而不是上线后的补救措施。一个成熟的人在回路设计，至少要包含任务风险分级、关键暂停点、人工确认机制、结构化反馈和可观测日志。当我们讨论 AI 是否能替代人时，更现实的问题其实是：如何让 AI 与人协同，把效率、质量和安全同时做好。

2026-06-04 16:41:00 346

原创日志系统的发展：从文本记录到可观测性平台的架构演进与实践指南

本文系统梳理日志系统的发展路径，覆盖单机文本日志、集中式日志、ELK、云原生日志、可观测性平台与 AI 智能分析，适合研发、运维、架构师和技术管理者理解日志架构演进、工程实践、成本治理与常见误区。

2026-06-03 20:03:06 345

原创一文讲明白 Agent 自主规划：原理、实现流程与最佳实践

Agent 自主规划的核心不是“让大模型自己想办法”，而是把目标拆解、工具调用、状态记忆、执行反馈和错误恢复组织成一个可控闭环。本文从原理、架构、实现步骤、提示词模板、工程示例和常见误区出发，帮助你判断什么时候该用 Agent、如何落地一个可靠的自主规划系统，以及怎样避免“看起来智能、实际不可控”的产品陷阱。

2026-06-02 16:22:47 315

原创 Agent 工具调用实战：从函数调用到可靠执行的设计方法

本文详解 Agent 工具调用的原理、流程与工程实践，覆盖工具定义、Schema 参数约束、调用决策、权限分级、结果校验和日志观测，适合 AI 应用、智能客服、办公自动化与产品技术团队构建可靠可控的生产级 Agent。

2026-06-02 08:45:00 309

原创 Multi-Agent 开发最佳实践：从任务拆解到协同交付的工程化指南

Multi-Agent 开发不是堆多个 Agent，而是通过主从分工、任务拆解、状态管理、权限隔离和结果审查，把复杂任务变成可协同、可验证、可交付的工程流程。本文系统讲解 Multi-Agent 架构设计、上下文传递、通信机制、成本控制、安全治理与评估方法，帮助开发者避免空转和过度设计，构建稳定可靠的 AI Agent 协同系统。

2026-06-01 17:49:04 352

原创 Agent 开发最佳实践：从原型到生产可用的工程化指南

本文系统梳理 Agent 开发最佳实践，围绕任务边界、架构设计、工具调用、Prompt、上下文工程、记忆、RAG、安全权限、可观测性与上线流程，帮助开发者将 AI Agent 从 Demo 打造成可交付、可维护、可评估的生产级系统。

2026-06-01 10:08:35 386

原创大模型应用开发必读：OpenAI 接口格式全方位详解与生产最佳实践

本文系统介绍了OpenAI及兼容API的接口格式规范，包括认证方式、基础请求规范、常见接口总览及详细参数说明。重点解析了模型列表查询和Chat Completions接口，涵盖请求格式、多模态内容支持、常用参数配置建议及响应结构。文章为开发者提供了OpenAI兼容API的完整技术参考，包括接口路径、请求头设置、消息格式、参数调优等核心内容，帮助实现低成本迁移和高效开发。

2026-05-28 09:36:44 16477 106

lishengzhen123的博客