- 博客(13)
- 资源 (1)
- 收藏
- 关注
原创 数字员工的Agent Skills快速蒸馏方法
这套方法可以转化为可复用的Agent Skill,让团队其他成员(包括初级工程师和AI Agent)都能以接近专家水平执行同类任务。4.工具先行:先封装常用工具(Jira API、Git操作、Playwright),再录制使用这些工具的过程。2.多视角录制:同一任务让不同专家录制,Agent可以学习"最优路径"和"多种可行方案"。1.不要追求完美录屏:真实工作中的"试错-修正"过程包含最宝贵的异常处理知识。5.持续迭代:Skill不是一次生成,而是通过"执行→反馈→再录制"循环进化。这是最关键的技术环节。
2026-04-03 17:34:45
170
原创 Claude Code对Harness设计与实现的启发
对 Harness 实现的启发:不要追求复杂的框架,而要构建可靠的约束环境——通过 Prompt 编排、工具流水线、权限治理、Hook 策略、Agent 调度、生命周期管理,将强大的 LLM 能力安全、可控、可扩展地"套上马鞍"。Claude Code的Harness不依赖单一安全机制,而是多层独立有效的约束:即使System Prompt被模型"遗忘",权限系统仍会拦截危险操作。上下文管理不是简单的"截断",而是分层的、有策略的信息保全机制。Harness:负责可靠地执行决策、管理资源、确保安全。
2026-04-01 16:12:48
333
原创 Harness核心思想与架构总结
Harness 并非简单的工具链、Prompt 模板或 API 包装,而是大语言模型运行的完整设计环境与调度执行框架,是支撑 AI Agent 在长周期、高复杂度任务中稳定、高质量、低偏差交付的 “底层操作系统”。其核心定位是:模型负责 “执行做事”,Harness 负责让模型在超长、复杂、易跑偏的工作流程中,始终 “做对事、交付符合预期的结果”。随着大模型的执行能力持续增强,传统的代码编写、内容创作、设计执行等基础执行工作,会逐渐被 AI 替代。
2026-03-27 10:24:06
451
原创 Openclaw的记忆分类与管理体系、技能自进化机制
功能:定义 Agent 的行为模式、语气、价值观和自我认知独特性:类似于系统提示词(System Prompt)的持久化版本,但支持运行时演化内容维度:Persona:角色定位(如"你是一位严谨的代码审查员")Tone:语言风格(正式/幽默/极简)Constraints:硬性规则(如"绝不生成不安全代码"、“必须验证事实”)Goals:长期目标(如"帮助用户提升代码质量")
2026-03-10 15:12:44
827
原创 OpenClaw的定位、核心组成与风险防范
随后,数据流进入 [智能体],这是由大模型驱动的“决策中枢”,负责解析语义、推理逻辑并规划任务步骤。贯穿全流程的 [记忆系统],则在本地持久化存储对话历史与用户偏好,为智能体的每一次决策提供上下文支持,确保交互的连续性。与传统AI仅提供建议不同,它具备「执行能力」,能直接操控电脑、连接应用,通过聊天软件接收指令并自动完成任务,实现「指令发出,结果落地」。这并非简单的功能堆砌,而是系统架构的质变。2.Agent(智能体):由大模型驱动,负责理解指令、推理任务、调用技能,是“思考决策中心”。
2026-03-09 14:33:15
489
原创 OpenCode、Claude Code和Cursor对比
Claude Code:由美国AI公司 Anthropic 官方开发并推出,Anthropic由前OpenAI核心成员创立,专注于研发安全、可靠的AI模型,Claude Code是其官方编程工具,深度优化了Claude模型在编程场景的能力。它深度集成在VS Code风格的IDE中,你通过图形界面进行编程,AI通过代码补全、侧边栏聊天、内联编辑等方式辅助你,你需要对每一处修改进行确认,保持对编码过程的直接控制。它仅支持Anthropic的Claude系列模型,由官方深度调优,编程体验连贯稳定。
2026-02-14 15:47:18
2756
原创 接口防刷(限流)Java
用户请求–> 第一道防线 前端限制/CDN/WAF,过滤大部分明显攻击–> 第二道防线 网关层限流(Sentinel/Gateway)–> 第三道防线 应用层限流(自定义注解/Redis+Lua)–> 第四道防线 核心业务验证(验证码/行为分析)–> 业务服务。– KEYS[1]: 限流Key, ARGV[1]: 桶容量(limit), ARGV[2]: 生成速率(rate), ARGV[3]: 时间间隔(interval)核心目标是:在保障系统稳定性和安全性的前提下,尽可能满足合法用户的访问需求。
2026-02-04 14:37:26
983
原创 基于Skills+Agent的AI Native Software Development
Agent 在运行时,根据上下文在这张图上做路径选择,而不是“顺序执行步骤”。这是 Skill + Agent 真正建立“自学习工程系统”的地方。需求不再只是“文档”,而是 Skill Graph 的起点节点。CI / 测试平台,是 Skill 化最容易、收益也最大的领域。这种模型适合“确定性工程”,但不适合复杂、频繁变化的软件系统。CI 从“执行系统”升级为“质量决策系统”。因此,Skill 描述的是**“做什么”4.哪些失败是偶发的,哪些是结构性问题。:从 CI / 测试开始,只做能力抽象。
2026-02-03 14:00:32
531
原创 AI 驱动测试平台蓝图
输入:PRD(Markdown / 飞书文档)、接口定义(OpenAPI / Swagger)、前端设计(Figma / HTML)、历史用例 & Bug。把“写测试、维护测试、分析结果、定位问题”这些human劳动,尽量变成 AI Agent 的工作。(6)测试知识库 & Agent Memory(长期收益)(5)AI 探索式测试 Agent(模拟人一样乱点)AI 用来:训练风险模型、优化用例生成、指导新人测试。(1)AI 测试用例生成平台(从需求到测试)(3)智能回归 & 风险评估引擎(非常重要)
2026-01-28 15:01:47
547
原创 AI Agent评测相关技术
基础能力评测:技术选型阶段,先设定一个“准入门槛”,以数据领域为例,会关注工具调用能力(Function Call、Tool using、MCP等)、数值计算与表格理解、数据幻觉的控制、复杂指令遵循,以及编码与Text-to-SQL。即便有了一个评测集,业务在变,产品定义在变,线上用户的使用方式也在变。组件:面向的是Agent的各个组成部分,可以把一个Agent的工作流程拆成几个阶段:先是召回,比如做Schema Linking,然后是理解与规划,接着进入洞察、分析与执行,最后是结果总结,把结论写成报告。
2026-01-22 14:01:27
406
原创 为什么IO 操作异步才有意义
当我们的代码执行一个 IO 请求(例如 Node.js 中的 fs.readFile())时,CPU 实际上只是向磁盘控制器下达一个指令:“把这个文件的数据读到内存的这个位置,完成后通知我。本质分析: 这种“异步化”处理并没有减少总的计算时间(甚至可能因为切换开销而变慢),但它的核心价值在于避免主线程被堵塞,从而保证了界面的流畅和用户的交互体验。这种行为的后果是,切土豆丝的总工作量一点没少,反而因为小红在土豆丝切好后再次接管烧菜这件事而引入了额外的“上下文切换开销”,导致整体效率变得更低。
2026-01-21 15:59:36
655
原创 Claude Code、Cursor与Codex的选择问题
Repo Wiki” 能自动生成项目文档,“长期记忆” 能学习你的开发习惯和偏好,非常适合大型项目、企业级开发、需要深度协同和全流程自动化的团队。定位与优势:它扮演的是一位 “思考深远的系统架构师”和“自主编程代理”。虽然强大,但它本质上仍是一个增强IDE的副驾驶,对于非常自主的全流程开发任务,可能不如Claude Code或Qoder的Agent模式强大。其生态配套和成熟度仍在发展中,企业版在深度协同、架构支撑等实战场景中也被认为仍有“初级性”,例如在业务场景理解、生成代码的架构适配性方面仍需提升。
2026-01-21 15:47:40
2902
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅