自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(27)
  • 资源 (1)
  • 收藏
  • 关注

原创 Agent 如何节省 Token 成本:从 Prompt 到工程监控的系统化优化指南

Agent 的 token 成本不只来自模型调用,还来自历史上下文、工具结果、RAG 召回、输出冗余与重试链路。本文从成本来源、上下文预算、模型路由、缓存、摘要压缩、工具结果裁剪、批处理、评测监控等方面,梳理一套可落地的 Agent token 降本方法。

2026-06-08 15:09:47 399 2

原创 一文讲清楚 Agent 权限怎么做:从最小权限到提示注入防护

AI Agent 不只是会调用接口的应用,它能理解上下文、组合工具、主动执行任务,因此权限设计必须覆盖工具、数据、网络、文件、消息、交易和系统配置等对象。本文从最小权限、默认拒绝、RBAC/ABAC、动态授权、HITL、沙箱隔离、凭证保护、审计日志和提示注入防护出发,给出一套可落地的 Agent 权限设计清单。

2026-06-04 12:31:08 3089 1

原创 AI 功能里的赞和踩有什么用:反馈数据如何驱动模型优化、产品迭代与安全治理

本文系统讲解 AI 功能中“赞”和“踩”的作用,解析用户反馈如何进入数据采集、问题归因、评测集建设、模型优化、RAG 调优和产品迭代闭环。适合 AI 产品经理、研发团队和运营人员理解反馈数据价值、处理逻辑与常见误区。

2026-06-03 20:51:06 1608 1

原创 OpenClaw vs Hermes Agent:企业级执行 vs 自我进化,一文读懂怎么选!

AI Agent 开源双子星深度对比:OpenClaw(GitHub 26.4w⭐)主打工程化落地,四层记忆+20+渠道+13,700+技能,适合企业自动化;Hermes Agent(53天10w⭐)主打闭环学习,四级记忆+自动技能进化+3,200+社区技能,越用越聪明。两者可互补组合:OpenClaw 做稳定执行引擎,Hermes 做持续学习大脑。短期落地选 OpenClaw,长期陪伴选 Hermes,组合使用才是终极答案!

2026-05-30 12:06:53 1821

原创 OpenClaw 和 Hermes 怎么结合:从聊天入口到隔离执行器的 Agent 工程实践

本文从工程实践角度拆解 OpenClaw 与 Hermes 的组合方式:OpenClaw 负责聊天入口、上下文、权限、任务编排和结果汇总,Hermes 负责隔离执行、命令运行、浏览器验证和复杂任务处理。文章覆盖调用链路、任务派发边界、上下文/凭据/写回控制、Cron 长任务、安全实践和常见坑,帮助开发者把二者组合成可落地、可审计、可停止的 Agent 工程系统。

2026-06-13 16:35:30 191

原创 AI Agent 沙箱怎么做:从文件、网络、工具到权限边界的工程实践

本文系统讲解 AI Agent 沙箱的工程设计方法,覆盖文件系统、网络访问、命令执行、凭据隔离、工具权限、资源配额、人工确认和审计日志等关键边界,帮助开发者把 Agent 从 Demo 推向可控、可追踪、可治理的生产执行环境。

2026-06-13 14:40:18 114

原创 大模型 API 智能路由怎么做:模型、供应商、成本与稳定性的工程实践

本文系统讲解大模型 API 智能路由的工程设计方法,覆盖模型、供应商、endpoint、API Key、参数和执行方式等路由对象,并从任务类型、请求规模、质量等级、实时健康状态和业务约束出发,拆解路由架构、评分策略、失败重试、fallback 降级、成本控制、灰度评估和常见坑,帮助团队构建稳定、可解释、可观测的大模型调用网关。

2026-06-12 15:28:27 328 2

原创 AI Agent 记忆怎么做:从短期上下文到长期记忆的工程实践

本文面向 AI Agent 开发者和产品技术团队,系统讲解 Agent 记忆怎么做,覆盖短期上下文、工作记忆、长期记忆、RAG 知识检索、记忆写入与召回、重排压缩、安全边界和审计机制,帮助团队构建可持续协作、可恢复、可治理的生产级 Agent 记忆系统。

2026-06-12 10:11:16 1117

原创 给 AI Agent 加可观测性:为什么要打印真实请求体、响应和错误码

AI Agent 能调用工具不等于工程上可用。本文从一次 sequential_image_generation_options.max_images 参数缺失引发的排障说起,介绍 Agent 调外部 API 时应该记录哪些可观测信息:工具选择、输入参数、请求体摘要、状态码、业务错误码、阶段耗时和产物信息,并说明如何在日志脱敏前提下快速定位问题。

2026-06-11 18:53:45 340

原创 火山方舟 byted-ark-seedream-skill 组图生成误报 429:根因是缺失 max_images 字段(附修复)

最近将火山方舟 Agent Plan 的 Seedream 视觉模型接入 OpenClaw 时,遇到一个典型但容易误判的问题:单图生成正常,使用官方 Skill byted-ark-seedream-skill 生成组图时,返回 429 AccountRateLimitExceeded。本文提供了解决方法。

2026-06-11 10:41:23 606

原创 从推理到纠错:ReAct、CoT 与自反思 Agent 的工程落地

面向 AI Agent 应用开发者、产品经理和架构师,系统拆解 CoT、ReAct 与 Self-Reflection 的作用边界、协同方式和工程落地方法,并结合运维、客服、订单、风控等场景说明如何构建会思考、会行动、会自我修正的 Agent。

2026-06-10 14:26:50 444 1

原创 手把手教你写 Skill:从需求定义到可复用工具流程的完整实践

本文面向 AI Agent 使用者和开发者,手把手讲解如何编写一个可复用 Skill,覆盖需求边界、目录结构、SKILL.md 编写、脚本封装、参数设计、错误处理、安全约束、测试验证和迭代维护,帮助团队把一次性操作沉淀为稳定、可复用的自动化能力。

2026-06-10 09:14:17 300

原创 评估 Agent 不能只凭感觉:一套可落地的量化指标与验收方法

面向 AI 产品、算法、研发与测试团队,系统梳理 Agent 效果评估从主观体验走向可量化指标的工程方法,包括任务成功率、质量、效率、稳定性、安全性、体验指标、黄金集构建、离线回放、在线灰度与持续监控。

2026-06-09 08:59:16 334

原创 Function Calling 与 MCP:Agent 工程中的工具调用边界与协议选择

本文面向 AI Agent 应用开发者、产品经理与架构师,从工程视角拆解 Function Calling 与 MCP 的核心差异:前者更像模型侧的函数调用契约,适合单应用内工具编排;后者更像 Agent 与外部能力系统之间的上下文协议,适合跨系统、跨团队、可治理的工具生态。

2026-06-09 08:58:26 299

原创 Agent 达到上下文后怎么处理:从滑动窗口到长期记忆的工程实践

Agent 达到上下文窗口上限后,不能简单截断历史,否则容易丢失目标、约束和工具结果。本文系统讲解上下文窗口限制、滑动窗口、摘要压缩、RAG 检索、任务状态外置、工具结果裁剪、分层记忆和降级策略,帮助开发者构建更稳定的长任务 Agent。

2026-06-08 16:09:51 325

原创 RAG 调优实战指南:混合检索、Query 改写、Rerank 与评估指标怎么做

本文面向 RAG 应用调优实践,系统总结混合检索、Query 改写、Rerank、上下文压缩和效果评估方法,帮助 AI 应用开发者提升召回率、答案准确性与可解释性,适合知识库问答、智能客服和企业搜索场景参考。

2026-06-07 14:20:57 355

原创 小白也能听懂 Transformer 架构原理:从 Attention 到大模型的入门指南

本文用小白也能听懂的方式讲解 Transformer 架构原理,覆盖 Attention、QKV、Self-Attention、Multi-Head Attention、位置编码、Encoder/Decoder 与大模型关系,适合 AI 初学者、产品经理和研发入门者快速建立知识框架。

2026-06-07 14:18:16 377

原创 提示词工程最佳实践:从会提问到可复用、可评估、可落地的 AI 工作流

本文系统讲解提示词工程的本质、结构与最佳实践,强调提示词不是“咒语”,而是通过角色、目标、上下文、步骤、约束、输出格式和失败处理来降低模型不确定性。文章结合 RAG、Agent、工作流等场景,说明如何设计、评估和迭代高质量提示词,让 AI 输出更稳定、可靠、可控。

2026-06-06 16:19:32 217

原创 谈谈如何实现 SLA 4 个 9:从可用性指标到稳定性工程落地

实现 SLA 的第一步,不是上高可用架构,而是定义“什么叫可用”。统计的是系统整体,还是某几个核心接口?统计周期是月、季度,还是年?HTTP 5xx 算不可用,那业务失败算不算?延迟超过阈值算不算不可用?计划维护时间是否排除?第三方服务故障是否计入?灰度、测试、压测流量是否纳入统计?如果这些边界没说清楚,SLA 就会变成口号,故障复盘时也很难判断责任和影响。实现 SLA 4 个 9,本质上是把稳定性从“出事后救火”变成“可度量、可治理、可演练、可持续优化”的工程体系。

2026-06-05 20:52:20 216

原创 OpenClaw 指令大全:从入门命令到自动化运维的 CLI 实用指南

本文系统整理 OpenClaw 常用 CLI 指令,覆盖 help/status/gateway/agent/message/channels/cron/skills/models/sessions/tasks/config/nodes/plugins 等命令的使用场景、典型示例和安全注意事项,适合新手快速入门,也适合日常运维和自动化排障时查阅。

2026-06-05 20:51:09 1606

原创 Human-in-the-loop 是什么:让 AI Agent 可控、可靠、可迭代的人机协同实践指南

Human-in-the-loop 的本质,是在人和 AI 之间建立清晰分工:AI 负责高频、重复、可计算的部分,人负责目标判断、风险把关、价值选择和最终责任。对 AI Agent 来说,HITL 应该被当作产品架构的一部分,而不是上线后的补救措施。一个成熟的人在回路设计,至少要包含任务风险分级、关键暂停点、人工确认机制、结构化反馈和可观测日志。当我们讨论 AI 是否能替代人时,更现实的问题其实是:如何让 AI 与人协同,把效率、质量和安全同时做好。

2026-06-04 16:41:00 346

原创 日志系统的发展:从文本记录到可观测性平台的架构演进与实践指南

本文系统梳理日志系统的发展路径,覆盖单机文本日志、集中式日志、ELK、云原生日志、可观测性平台与 AI 智能分析,适合研发、运维、架构师和技术管理者理解日志架构演进、工程实践、成本治理与常见误区。

2026-06-03 20:03:06 345

原创 一文讲明白 Agent 自主规划:原理、实现流程与最佳实践

Agent 自主规划的核心不是“让大模型自己想办法”,而是把目标拆解、工具调用、状态记忆、执行反馈和错误恢复组织成一个可控闭环。本文从原理、架构、实现步骤、提示词模板、工程示例和常见误区出发,帮助你判断什么时候该用 Agent、如何落地一个可靠的自主规划系统,以及怎样避免“看起来智能、实际不可控”的产品陷阱。

2026-06-02 16:22:47 315

原创 Agent 工具调用实战:从函数调用到可靠执行的设计方法

本文详解 Agent 工具调用的原理、流程与工程实践,覆盖工具定义、Schema 参数约束、调用决策、权限分级、结果校验和日志观测,适合 AI 应用、智能客服、办公自动化与产品技术团队构建可靠可控的生产级 Agent。

2026-06-02 08:45:00 309

原创 Multi-Agent 开发最佳实践:从任务拆解到协同交付的工程化指南

Multi-Agent 开发不是堆多个 Agent,而是通过主从分工、任务拆解、状态管理、权限隔离和结果审查,把复杂任务变成可协同、可验证、可交付的工程流程。本文系统讲解 Multi-Agent 架构设计、上下文传递、通信机制、成本控制、安全治理与评估方法,帮助开发者避免空转和过度设计,构建稳定可靠的 AI Agent 协同系统。

2026-06-01 17:49:04 352

原创 Agent 开发最佳实践:从原型到生产可用的工程化指南

本文系统梳理 Agent 开发最佳实践,围绕任务边界、架构设计、工具调用、Prompt、上下文工程、记忆、RAG、安全权限、可观测性与上线流程,帮助开发者将 AI Agent 从 Demo 打造成可交付、可维护、可评估的生产级系统。

2026-06-01 10:08:35 386

原创 大模型应用开发必读:OpenAI 接口格式全方位详解与生产最佳实践

本文系统介绍了OpenAI及兼容API的接口格式规范,包括认证方式、基础请求规范、常见接口总览及详细参数说明。重点解析了模型列表查询和Chat Completions接口,涵盖请求格式、多模态内容支持、常用参数配置建议及响应结构。文章为开发者提供了OpenAI兼容API的完整技术参考,包括接口路径、请求头设置、消息格式、参数调优等核心内容,帮助实现低成本迁移和高效开发。

2026-05-28 09:36:44 16477 106

技能优化byted-ark-seedream-skill增加sequential-image-generation-options.max-images传参,解决组图生成失败报429错误码问题

基于火山官方SKILL(日期:20260610),增加sequential_image_generation_options.max_images传参,解决组图生成失败,报429错误码问题。 原官方技能地址: https://findskill.com/volcengine/agentplan/byted-ark-seedream-skill 建议优先检查官方技能是否已更新,优先使用官方技能,如官方技能暂未解决组图生成失败问题,可参考该资源实现。

2026-06-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除