Gwendolyn�-CSDN博客

原创数字员工的Agent Skills快速蒸馏方法

这套方法可以转化为可复用的Agent Skill，让团队其他成员（包括初级工程师和AI Agent）都能以接近专家水平执行同类任务。4.工具先行：先封装常用工具（Jira API、Git操作、Playwright），再录制使用这些工具的过程。2.多视角录制：同一任务让不同专家录制，Agent可以学习"最优路径"和"多种可行方案"。1.不要追求完美录屏：真实工作中的"试错-修正"过程包含最宝贵的异常处理知识。5.持续迭代：Skill不是一次生成，而是通过"执行→反馈→再录制"循环进化。这是最关键的技术环节。

2026-04-03 17:34:45 170

原创 Claude Code对Harness设计与实现的启发

对 Harness 实现的启发：不要追求复杂的框架，而要构建可靠的约束环境——通过 Prompt 编排、工具流水线、权限治理、Hook 策略、Agent 调度、生命周期管理，将强大的 LLM 能力安全、可控、可扩展地"套上马鞍"。Claude Code的Harness不依赖单一安全机制，而是多层独立有效的约束：即使System Prompt被模型"遗忘"，权限系统仍会拦截危险操作。上下文管理不是简单的"截断"，而是分层的、有策略的信息保全机制。Harness：负责可靠地执行决策、管理资源、确保安全。

2026-04-01 16:12:48 333

原创 Harness核心思想与架构总结

Harness 并非简单的工具链、Prompt 模板或 API 包装，而是大语言模型运行的完整设计环境与调度执行框架，是支撑 AI Agent 在长周期、高复杂度任务中稳定、高质量、低偏差交付的 “底层操作系统”。其核心定位是：模型负责 “执行做事”，Harness 负责让模型在超长、复杂、易跑偏的工作流程中，始终 “做对事、交付符合预期的结果”。随着大模型的执行能力持续增强，传统的代码编写、内容创作、设计执行等基础执行工作，会逐渐被 AI 替代。

2026-03-27 10:24:06 451

原创 Openclaw的记忆分类与管理体系、技能自进化机制

功能：定义 Agent 的行为模式、语气、价值观和自我认知独特性：类似于系统提示词（System Prompt）的持久化版本，但支持运行时演化内容维度：Persona：角色定位（如"你是一位严谨的代码审查员"）Tone：语言风格（正式/幽默/极简）Constraints：硬性规则（如"绝不生成不安全代码"、“必须验证事实”）Goals：长期目标（如"帮助用户提升代码质量"）

2026-03-10 15:12:44 827

原创 OpenClaw的定位、核心组成与风险防范

随后，数据流进入 [智能体]，这是由大模型驱动的“决策中枢”，负责解析语义、推理逻辑并规划任务步骤。贯穿全流程的 [记忆系统]，则在本地持久化存储对话历史与用户偏好，为智能体的每一次决策提供上下文支持，确保交互的连续性。与传统AI仅提供建议不同，它具备「执行能力」，能直接操控电脑、连接应用，通过聊天软件接收指令并自动完成任务，实现「指令发出，结果落地」。这并非简单的功能堆砌，而是系统架构的质变。2.Agent（智能体）：由大模型驱动，负责理解指令、推理任务、调用技能，是“思考决策中心”。

2026-03-09 14:33:15 489

原创 OpenCode、Claude Code和Cursor对比

Claude Code：由美国AI公司 Anthropic 官方开发并推出，Anthropic由前OpenAI核心成员创立，专注于研发安全、可靠的AI模型，Claude Code是其官方编程工具，深度优化了Claude模型在编程场景的能力。它深度集成在VS Code风格的IDE中，你通过图形界面进行编程，AI通过代码补全、侧边栏聊天、内联编辑等方式辅助你，你需要对每一处修改进行确认，保持对编码过程的直接控制。它仅支持Anthropic的Claude系列模型，由官方深度调优，编程体验连贯稳定。

2026-02-14 15:47:18 2756

原创接口防刷（限流）Java

用户请求–> 第一道防线前端限制/CDN/WAF，过滤大部分明显攻击–> 第二道防线网关层限流（Sentinel/Gateway）–> 第三道防线应用层限流（自定义注解/Redis+Lua）–> 第四道防线核心业务验证（验证码/行为分析）–> 业务服务。– KEYS[1]: 限流Key, ARGV[1]: 桶容量(limit), ARGV[2]: 生成速率(rate), ARGV[3]: 时间间隔(interval)核心目标是：在保障系统稳定性和安全性的前提下，尽可能满足合法用户的访问需求。

2026-02-04 14:37:26 983

原创基于Skills+Agent的AI Native Software Development

Agent 在运行时，根据上下文在这张图上做路径选择，而不是“顺序执行步骤”。这是 Skill + Agent 真正建立“自学习工程系统”的地方。需求不再只是“文档”，而是 Skill Graph 的起点节点。CI / 测试平台，是 Skill 化最容易、收益也最大的领域。这种模型适合“确定性工程”，但不适合复杂、频繁变化的软件系统。CI 从“执行系统”升级为“质量决策系统”。因此，Skill 描述的是**“做什么”4.哪些失败是偶发的，哪些是结构性问题。：从 CI / 测试开始，只做能力抽象。

2026-02-03 14:00:32 531

原创 AI 驱动测试平台蓝图

输入：PRD（Markdown / 飞书文档）、接口定义（OpenAPI / Swagger）、前端设计（Figma / HTML）、历史用例 & Bug。把“写测试、维护测试、分析结果、定位问题”这些human劳动，尽量变成 AI Agent 的工作。（6）测试知识库 & Agent Memory（长期收益）（5）AI 探索式测试 Agent（模拟人一样乱点）AI 用来：训练风险模型、优化用例生成、指导新人测试。（1）AI 测试用例生成平台（从需求到测试）（3）智能回归 & 风险评估引擎（非常重要）

2026-01-28 15:01:47 547

原创 AI Agent评测相关技术

基础能力评测：技术选型阶段，先设定一个“准入门槛”，以数据领域为例，会关注工具调用能力（Function Call、Tool using、MCP等）、数值计算与表格理解、数据幻觉的控制、复杂指令遵循，以及编码与Text-to-SQL。即便有了一个评测集，业务在变，产品定义在变，线上用户的使用方式也在变。组件：面向的是Agent的各个组成部分，可以把一个Agent的工作流程拆成几个阶段：先是召回，比如做Schema Linking，然后是理解与规划，接着进入洞察、分析与执行，最后是结果总结，把结论写成报告。

2026-01-22 14:01:27 406

原创为什么IO 操作异步才有意义

当我们的代码执行一个 IO 请求（例如 Node.js 中的 fs.readFile()）时，CPU 实际上只是向磁盘控制器下达一个指令：“把这个文件的数据读到内存的这个位置，完成后通知我。本质分析: 这种“异步化”处理并没有减少总的计算时间（甚至可能因为切换开销而变慢），但它的核心价值在于避免主线程被堵塞，从而保证了界面的流畅和用户的交互体验。这种行为的后果是，切土豆丝的总工作量一点没少，反而因为小红在土豆丝切好后再次接管烧菜这件事而引入了额外的“上下文切换开销”，导致整体效率变得更低。

2026-01-21 15:59:36 655

原创 Claude Code、Cursor与Codex的选择问题

Repo Wiki” 能自动生成项目文档，“长期记忆” 能学习你的开发习惯和偏好，非常适合大型项目、企业级开发、需要深度协同和全流程自动化的团队。定位与优势：它扮演的是一位 “思考深远的系统架构师”和“自主编程代理”。虽然强大，但它本质上仍是一个增强IDE的副驾驶，对于非常自主的全流程开发任务，可能不如Claude Code或Qoder的Agent模式强大。其生态配套和成熟度仍在发展中，企业版在深度协同、架构支撑等实战场景中也被认为仍有“初级性”，例如在业务场景理解、生成代码的架构适配性方面仍需提升。

2026-01-21 15:47:40 2902

原创接口自动化测试相关参考资料

1.可能遇到的难点2.编写步骤。

2025-10-16 14:51:03 158

ctfcvgjhbmnj的博客