自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (1)
  • 收藏
  • 关注

原创 数字员工的Agent Skills快速蒸馏方法

这套方法可以转化为可复用的Agent Skill,让团队其他成员(包括初级工程师和AI Agent)都能以接近专家水平执行同类任务。4.工具先行:先封装常用工具(Jira API、Git操作、Playwright),再录制使用这些工具的过程。2.多视角录制:同一任务让不同专家录制,Agent可以学习"最优路径"和"多种可行方案"。1.不要追求完美录屏:真实工作中的"试错-修正"过程包含最宝贵的异常处理知识。5.持续迭代:Skill不是一次生成,而是通过"执行→反馈→再录制"循环进化。这是最关键的技术环节。

2026-04-03 17:34:45 170

原创 Claude Code对Harness设计与实现的启发

对 Harness 实现的启发:不要追求复杂的框架,而要构建可靠的约束环境——通过 Prompt 编排、工具流水线、权限治理、Hook 策略、Agent 调度、生命周期管理,将强大的 LLM 能力安全、可控、可扩展地"套上马鞍"。Claude Code的Harness不依赖单一安全机制,而是多层独立有效的约束:即使System Prompt被模型"遗忘",权限系统仍会拦截危险操作。上下文管理不是简单的"截断",而是分层的、有策略的信息保全机制。Harness:负责可靠地执行决策、管理资源、确保安全。

2026-04-01 16:12:48 333

原创 Harness核心思想与架构总结

Harness 并非简单的工具链、Prompt 模板或 API 包装,而是大语言模型运行的完整设计环境与调度执行框架,是支撑 AI Agent 在长周期、高复杂度任务中稳定、高质量、低偏差交付的 “底层操作系统”。其核心定位是:模型负责 “执行做事”,Harness 负责让模型在超长、复杂、易跑偏的工作流程中,始终 “做对事、交付符合预期的结果”。随着大模型的执行能力持续增强,传统的代码编写、内容创作、设计执行等基础执行工作,会逐渐被 AI 替代。

2026-03-27 10:24:06 451

原创 Openclaw的记忆分类与管理体系、技能自进化机制

功能:定义 Agent 的行为模式、语气、价值观和自我认知独特性:类似于系统提示词(System Prompt)的持久化版本,但支持运行时演化内容维度:Persona:角色定位(如"你是一位严谨的代码审查员")Tone:语言风格(正式/幽默/极简)Constraints:硬性规则(如"绝不生成不安全代码"、“必须验证事实”)Goals:长期目标(如"帮助用户提升代码质量")

2026-03-10 15:12:44 827

原创 OpenClaw的定位、核心组成与风险防范

随后,数据流进入 [智能体],这是由大模型驱动的“决策中枢”,负责解析语义、推理逻辑并规划任务步骤。贯穿全流程的 [记忆系统],则在本地持久化存储对话历史与用户偏好,为智能体的每一次决策提供上下文支持,确保交互的连续性。与传统AI仅提供建议不同,它具备「执行能力」,能直接操控电脑、连接应用,通过聊天软件接收指令并自动完成任务,实现「指令发出,结果落地」。这并非简单的功能堆砌,而是系统架构的质变。2.Agent(智能体):由大模型驱动,负责理解指令、推理任务、调用技能,是“思考决策中心”。

2026-03-09 14:33:15 489

原创 OpenCode、Claude Code和Cursor对比

Claude Code:由美国AI公司 Anthropic 官方开发并推出,Anthropic由前OpenAI核心成员创立,专注于研发安全、可靠的AI模型,Claude Code是其官方编程工具,深度优化了Claude模型在编程场景的能力。它深度集成在VS Code风格的IDE中,你通过图形界面进行编程,AI通过代码补全、侧边栏聊天、内联编辑等方式辅助你,你需要对每一处修改进行确认,保持对编码过程的直接控制。它仅支持Anthropic的Claude系列模型,由官方深度调优,编程体验连贯稳定。

2026-02-14 15:47:18 2756

原创 接口防刷(限流)Java

用户请求–> 第一道防线 前端限制/CDN/WAF,过滤大部分明显攻击–> 第二道防线 网关层限流(Sentinel/Gateway)–> 第三道防线 应用层限流(自定义注解/Redis+Lua)–> 第四道防线 核心业务验证(验证码/行为分析)–> 业务服务。– KEYS[1]: 限流Key, ARGV[1]: 桶容量(limit), ARGV[2]: 生成速率(rate), ARGV[3]: 时间间隔(interval)核心目标是:在保障系统稳定性和安全性的前提下,尽可能满足合法用户的访问需求。

2026-02-04 14:37:26 983

原创 基于Skills+Agent的AI Native Software Development

Agent 在运行时,根据上下文在这张图上做路径选择,而不是“顺序执行步骤”。这是 Skill + Agent 真正建立“自学习工程系统”的地方。需求不再只是“文档”,而是 Skill Graph 的起点节点。CI / 测试平台,是 Skill 化最容易、收益也最大的领域。这种模型适合“确定性工程”,但不适合复杂、频繁变化的软件系统。CI 从“执行系统”升级为“质量决策系统”。因此,Skill 描述的是**“做什么”4.哪些失败是偶发的,哪些是结构性问题。:从 CI / 测试开始,只做能力抽象。

2026-02-03 14:00:32 531

原创 AI 驱动测试平台蓝图

输入:PRD(Markdown / 飞书文档)、接口定义(OpenAPI / Swagger)、前端设计(Figma / HTML)、历史用例 & Bug。把“写测试、维护测试、分析结果、定位问题”这些human劳动,尽量变成 AI Agent 的工作。(6)测试知识库 & Agent Memory(长期收益)(5)AI 探索式测试 Agent(模拟人一样乱点)AI 用来:训练风险模型、优化用例生成、指导新人测试。(1)AI 测试用例生成平台(从需求到测试)(3)智能回归 & 风险评估引擎(非常重要)

2026-01-28 15:01:47 547

原创 AI Agent评测相关技术

基础能力评测:技术选型阶段,先设定一个“准入门槛”,以数据领域为例,会关注工具调用能力(Function Call、Tool using、MCP等)、数值计算与表格理解、数据幻觉的控制、复杂指令遵循,以及编码与Text-to-SQL。即便有了一个评测集,业务在变,产品定义在变,线上用户的使用方式也在变。组件:面向的是Agent的各个组成部分,可以把一个Agent的工作流程拆成几个阶段:先是召回,比如做Schema Linking,然后是理解与规划,接着进入洞察、分析与执行,最后是结果总结,把结论写成报告。

2026-01-22 14:01:27 406

原创 为什么IO 操作异步才有意义

当我们的代码执行一个 IO 请求(例如 Node.js 中的 fs.readFile())时,CPU 实际上只是向磁盘控制器下达一个指令:“把这个文件的数据读到内存的这个位置,完成后通知我。本质分析: 这种“异步化”处理并没有减少总的计算时间(甚至可能因为切换开销而变慢),但它的核心价值在于避免主线程被堵塞,从而保证了界面的流畅和用户的交互体验。这种行为的后果是,切土豆丝的总工作量一点没少,反而因为小红在土豆丝切好后再次接管烧菜这件事而引入了额外的“上下文切换开销”,导致整体效率变得更低。

2026-01-21 15:59:36 655

原创 Claude Code、Cursor与Codex的选择问题

Repo Wiki” 能自动生成项目文档,“长期记忆” 能学习你的开发习惯和偏好,非常适合大型项目、企业级开发、需要深度协同和全流程自动化的团队。定位与优势:它扮演的是一位 “思考深远的系统架构师”和“自主编程代理”。虽然强大,但它本质上仍是一个增强IDE的副驾驶,对于非常自主的全流程开发任务,可能不如Claude Code或Qoder的Agent模式强大。其生态配套和成熟度仍在发展中,企业版在深度协同、架构支撑等实战场景中也被认为仍有“初级性”,例如在业务场景理解、生成代码的架构适配性方面仍需提升。

2026-01-21 15:47:40 2902

原创 接口自动化测试相关参考资料

1.可能遇到的难点2.编写步骤。

2025-10-16 14:51:03 158

Y1901 精品实用矢量素材.rar

矢量素材,可以用来制作网页,动态图片的设计等功能,下载压缩包之后解压即可使用哦,素材内容很广泛、比较新颖、实用

2020-06-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除