自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(139)
  • 收藏
  • 关注

原创 同事.Skill刷屏出圈,AI“技能蒸馏”的底层规则

最近技术圈最荒诞又最真实的一幕:一个叫“同事.skill”的GitHub项目,5天狂揽超6600颗星,冲上热搜。紧接着,“前任.skill”“老板.skill”“父母.skill”——十几个衍生项目排着队冒了出来。网友辣评:“同事,散是Token,聚是Skill。但这波热度真正让人后背发凉的,不是Skill本身有多强,而是社交媒体上蔓延开的那种恐慌——如果员工的技能可以被炼化成Skill,是不是被炼化的那个人,就可以很容易被替代了?有人在网络上写道:“大模型+同事skill+记忆插件=你的同事。

2026-04-17 12:35:03 254

原创 OpenAI祭出GPT-5.4神装!Codex同款Harness全面开放

如果你最近刷技术社区,大概率已经看到了那条消息:GPT-5.4带着原生harness和沙盒能力全面开放了。七家头部沙盒厂商一夜之间全部接入,Agents SDK被彻底重写。但真正让圈内炸锅的不是新模型本身,而是这波操作背后释放的信号——OpenAI下场收编了整个Agent基建层。LangChain、CrewAI、LangGraph这些第三方框架的生存空间,被一刀砍在了最致命的位置。很多人开始意识到:过去两年搭建的那些Agent脚手架,可能要重新评估了。这不是模型能力的升级。

2026-04-17 11:49:44 42

原创 Claude 开始进桌面之后,AI 系统的测试边界是不是又变了?

最近大家关注这些 AI 更新,很多人看到的是模型更强了、工具更多了、场景更热闹了。但站在测试的角度,真正值得重视的不是热闹,而是边界变化。当 AI 开始走进桌面、走进办公流程、走进企业系统,测试面对的就不再只是“它答得对不对”,而是:它会不会做错事它做事能不能做完整它出错后能不能恢复它在真实环境里能不能长期稳定运行这也是为什么我一直觉得,接下来真正有价值的测试能力,不会只是会写自动化脚本,也不会只是会调几个 Prompt。真正稀缺的,是能把模型、工作流、Agent、数据、权限和安全。

2026-04-16 17:50:13 262

原创 Anthropic 托管 Agent 平台上线后,测试对象开始从功能点转向运行系统

Anthropic 把 Claude Managed Agents 推到 public beta,开始直接提供托管式 Agent 运行基础设施;DeepSeek 在产品入口中加入了 instant 和 expert 模式,模型能力开始显式分层;PyTorch Foundation 接收 Safetensors,模型分发安全开始进入更明确的标准化阶段;前端代码生成开始引入视觉反馈闭环;Google 也在继续推进端侧 AI Gallery。

2026-04-14 11:34:44 387

原创 Modern.js 3.0 正式发布:更聚焦的 Web 框架,全面拥抱 Rspack 与 RSC

距离 Modern.js 2.0 发布已过去三年。在这期间,Modern.js 累计发布了超过 100 个版本,在行业头部互联网公司内部,其活跃 Web 项目使用占比从 2025 年初的 40% 增长至接近 70%。经过大量重构与反馈沉淀,团队决定推出,对框架进行全面升级。从 Modern.js 2.0 升级到 3.0,你需要:移除 webpack 相关依赖,确保项目兼容 Rspack升级 React 至 18+(推荐 19)Node.js 最低要求 20(推荐 22 LTS)

2026-04-14 11:27:05 538

原创 OpenClaw 技能到底去哪装?这 11 个平台帮你把坑踩完了

用:这里的 Skill 默认不安全。

2026-04-10 17:39:34 353

原创 OpenClaw大版本更新之后,Agent开始向“系统级智能体”演化

最近两个月,如果你在用一些新的 AI 工具,应该会有一个很直观的感受:有些系统,已经不再是“你点一下,它回一句”。它开始自己跑流程、自己调工具、甚至在你不操作的时候还在持续执行。问题也随之出现:有时候结果是对的,但过程完全不可控有时候能跑通一次,但跑不稳第二次有记忆,但越用越乱这类问题,本质上不是模型能力的问题,而是系统形态变了。这次 OpenClaw 的更新,把这件事讲得更清楚了一步:AI正在从“被调用的能力”,变成“持续运行的系统”。

2026-04-10 16:19:19 178

原创 AI术语看不懂?这24个核心概念,帮你把AI底层逻辑一次讲清

如果把AI系统拆开看,本质就三件事:模型能力(Transformer + 预训练)数据与知识(Embedding + RAG)控制与执行(Prompt + Agent + 工具)你看到的所有新概念,基本都在这三层里变化。AI不是一个工具,而是一套完整的工程体系。谁理解这套体系,谁才能真正用好AI。

2026-04-09 18:02:11 277

原创 Claude Code 一周烧掉一半配额?我从逆向工程中看到了 Agent 测试的致命盲区

很多人已经开始感觉到不对劲了。花 30 美元买的 Claude Code 周配额,以前能撑三四天,现在一上午就烧掉一半。你以为是自己的对话太密集,但账单上显示的 Token 消耗数字,怎么看都不对劲。这不是个例。有人逆向工程了 Claude Code 的源码,发现了一连串叠加的 bug。其中一条最致命:一旦你进入 Extra Usage(超额付费)模式,客户端会。你起身倒杯水,回来就是一次完整的上下文重建,费用直接从余额里扣,没有任何提示。这已经不是“AI 工具偶尔犯错”的问题了。这是一个。

2026-04-08 12:02:53 705

原创 Claude Code 编程哲学正在改变一切:从“理解代码”到“跑通代码”

从“理解驱动”走向“执行驱动”, 这可能才是 Coding Agent 真正的分水岭。当一个复杂系统报错时,工程师很少会先完整理解系统,而是优先解决当前报错。Claude Code 出来之后,整个思路开始发生明显变化。CodeGraph:节省 Token,但解决不了核心问题。这个变化,不只是工具层面的升级,更是工程思维的变化。Claude Code 为什么选择“终端调试范式”真正的转变:从“看懂代码”到“跑通代码”结合 IDE 上下文构建“高质量上下文”在真实工程问题中,真正难的往往是后者。

2026-04-07 22:58:55 190

原创 OpenAI 把 Codex 接进 Claude Code,这件事比你想的更“工程化”

AI 开发正在从“选模型”,走向“编排模型”下一步真正的竞争,不再是谁更强,而是:谁的 Agent 更会协作谁的工作流更稳定谁的成本更可控未来的核心能力,不是用 AI,而是设计 AI 系统。

2026-04-07 22:49:58 471

原创 Claude Code、Codex接管开发流程,测试工程师下一步该做什么?

最近一周,AI开发工具的更新有点密集,而且方向非常一致:Claude Code 推出了自动决策模式,开始自己决定代码怎么写、文件怎么改 Codex 以终端助手的形式回归,可以直接接管编码任务 谷歌开源了 TimesFM,把时间序列预测能力做成基础模型 一批推理模型开始开源,工程能力进一步下沉这些变化叠在一起,其实在指向同一件事:AI正在从“辅助工具”,变成“可以执行完整开发流程的角色”从写代码,到运行,再到修复问题,很多环节已经可以自动完成对开发来说,这是效率问题 但对测试来说,是角色问题。

2026-04-07 22:42:25 717

原创 零基础30分钟搞定 Claude Code,这一步90%的人直接跳过了

普通人用法:问问题高手用法:让AI:理解你规划任务自动执行。

2026-04-01 10:49:15 185

原创 基于Agent-SDK的Claude 记忆插件来了:上下文不再丢,Agent 开始“记住你是谁”

你有没有遇到过这种情况:写到一半,模型“忘了”你刚刚的设计约束多轮对话后,代码风格开始漂移上下文越长,token 越贵,但效果反而变差问题不在模型能力,而在。claude-mem—— 给 Claude Code 加一层“长期记忆系统”。

2026-03-31 14:51:06 223

原创 90分钟挖出20年Linux漏洞,Claude 5.0内测曝光:软件工程正在被重写

如果你是测试工程师,现在要思考的已经不是:“AI会不会替代我”

2026-03-30 18:37:22 377

原创 即梦视频3.0Pro刚发布,这一波,有人已经开始拿结果了

普通人第一次可以低成本参与内容生产但真正决定结果的,依然是:你做什么内容你怎么表达你能不能持续做如果你现在的问题是:不知道做什么方向做了但没流量有流量但不会变现关注我们的免费公开课从选题 到提示词 到视频生成 再到账号起号和变现闭环是可以一步一步照着做的那种。已经帮一批人跑通从0到起号的过程。想看完整案例和路径,可以进群,每周都有免费公开课哦~

2026-03-30 11:53:19 472

原创 告别重复提问:用Claude Skill打造你的AI专属工作流

现在,我每天打开Claude,不再需要像传教士一样念叨那些重复的规则。一句“帮我review这段代码”或“写周报”,它就知道该用什么样的语气、什么样的格式、什么样的流程来干活。这种感觉就像是给Claude发了一张“上岗证”,它终于变成了真正了解我工作习惯的专属助手。其实Skill的门槛比你想象的低得多。你不需要会写复杂的代码,只要会用Markdown把你的工作流程写清楚,Claude就能学会。如果你平时有那种“每次都要重复说一遍”的场景,不妨花半小时试试看。

2026-03-25 22:15:15 364

原创 普通人也能用OpenClaw?看完这5个例子你就明白了

OpenClaw现在确实还不够完美。它偶尔会犯傻、执行速度不快、有时候需要你盯着别让它乱来。但它代表了一个趋势:AI正在从“聊天机器人”变成“数字员工”。以前我们说“AI能做什么”,说的是它能回答什么问题。现在说的是“AI能帮我做什么事”,是它能替我完成哪些工作。这个转变,普通人值得早点体验。就像金成磊说的,“刚开始它笨笨的,你问东它答西”。但养几天之后,它就能干活了。现在的投入,可能是未来几个月的效率红利。

2026-03-24 11:19:26 253

原创 一次压测12万请求,AI 30秒找到系统瓶颈:性能测试正在被重写

AI 正在重塑软件测试的很多环节:AI生成测试用例AI编写自动化脚本AI执行测试任务AI分析测试结果而性能测试数据分析,恰恰是最适合 AI 介入的场景之一。海量监控数据 + 模式识别。未来的测试工程师,可能不再需要花几个小时盯着 Grafana 曲线。“帮我分析这次压测的性能瓶颈。AI 就会给出答案。软件测试,也正在从经验驱动走向智能驱动。

2026-03-23 16:04:18 361

原创 Django 模板变量与标签实战指南:90% 的 Django 新手都忽略了这几个细节

很多刚学习 Django 的开发者都会产生一个错觉:模板层只是 HTML + {{变量}}实际上,在真实项目中,模板层承担着大量工作:页面逻辑控制数据循环渲染表单状态保持组件复用如果没有理解 Django 模板机制,很容易写出。这篇文章我们系统梳理 Django 模板层最核心的内容。

2026-03-23 15:41:32 354

原创 测试小白的第一课:从零安装OpenClaw,亲手跑通第一个AI智能体

从零到跑通第一个智能体,其实没那么难对吧?我当初卡在Python版本问题上整整两天,就是没人告诉我3.12不行。希望这篇教程帮你避开了我踩过的那些坑。OpenClaw能做的事情远不止查天气,你可以让它帮你处理文档、写代码、分析数据……等你熟悉了基本用法,会发现这东西的想象力空间挺大的。有什么问题欢迎在评论区留言,我看到就会回。下一篇我打算写怎么给智能体加上网页界面,让不是程序员的人也能用。想看的可以点个关注。好了,去试试你的第一个智能体吧,祝玩得开心!

2026-03-23 15:30:29 512

原创 第一次听说“智能体”?10分钟搞懂OpenClaw是啥、能干啥、怎么装

OpenClaw的火爆不是偶然。过去几年,AI一直在“变聪明”,但OpenClaw第一次让AI“长出了手”。它不再只是坐在对话框里回答问题,而是真的能帮你打开软件、整理文件、发消息、跑任务。你睡觉的时候,它可能在帮你抓数据、写报告、监控网站。你开会的时候,它可能在帮你整理会议纪要、归档文件。这才是AI该有的样子——不是玩具,是工具;不是聊天对象,是数字员工。当然,它还在快速迭代中。GitHub上已经超过27.8万星标,社区技能超过1.3万个,国内“云养虾”社区用户超10万。

2026-03-23 14:42:52 963

原创 AI真的会抢走工作吗?Anthropic最新研究给出了第一份真实数据

AI不会马上取代人类。工作的方式。未来最危险的人不是:被AI取代的人。不会使用AI的人。

2026-03-20 11:33:06 225

原创 超越谷歌Veo、登顶全球第一!国产AI视频,终于在这个赛道扬眉吐气

站在2026年春天回望,AI视频生成领域的变化翻天覆地。从Sora掀起的第一波浪潮,到Veo、Kling、Seedance的百家争鸣,再到SkyReels V4以“全模态参考+音视频联合生成+统一任务框架+全模态强化学习”的四位一体能力登顶全球——我们正在见证一个新时代的开启。在这个时代里,视频创作不再是专业团队的专属特权,而是每一个有创意的人都能触及的表达方式。而SkyReels V4所代表的技术方向——用一个模型、一次操作,完成从文字构思到音视频成品的全流程创作——正是通往那个未来的最清晰路径。

2026-03-20 10:43:51 931

原创 从“打工人”到“驯兽师”:OpenClaw爆火后,这3类岗位工资正在翻倍

还在担心被AI取代?会“养龙虾”的人已经开始挑老板了。三月的深圳,天气还没热起来,腾讯大厦楼下却排起了数百人的长队。他们抱着笔记本电脑,等着免费安装一只“龙虾”——OpenClaw开源AI智能体。这一幕颇有象征意义:几个月前,我们还焦虑地问“AI会不会让我失业”;现在,大家却争着领一只“AI员工”回家。更戏剧性的是,当大多数人还在琢磨怎么给这只“龙虾”喂食时,一小拨人已经靠“驯虾”赚得盆满钵满。。这一切来得太快。春节后还是极客圈的自嗨,3月初就变成全民狂欢。现在,它又开始悄然重塑招聘市场的薪酬逻辑。

2026-03-17 10:57:52 183

原创 LangChain + DeepSeek 实战拆解:从 LCEL 到智能体,如何真正“做出”一个可控 AI 系统?

大模型很强。那你做的不是系统,只是调用接口。真正的工程问题是:多步骤推理怎么组织?外部数据怎么接入?工具怎么安全调用?对话怎么长期记忆?结果怎么结构化输出?这才是 LangChain 解决的问题。

2026-03-17 10:28:49 362

原创 测试用例生成智能体应用实战(附核心代码)

企业真正关心的不是模型能写多少内容,而是:是否能读取真实数据库是否能保证结果可控是否可以嵌入现有系统是否支持批量执行是否具备安全校验本文拆解一套基于 数据库 + 双智能体 + 校验层 的测试用例生成方案,并给出核心实现代码。企业真实需求模型为什么纯 RAG 不够双智能体架构设计SQL 智能体实现(含代码)用例生成智能体实现(含代码 + 时序图)三层校验机制API 封装与系统集成生产环境风险控制测试工程师能力升级典型企业场景:需求存储在数据库希望一键生成测试用例输出必须结构化可自动入库可定时批量执行核心不是“

2026-03-16 12:32:49 491

原创 Claude Skills 官方指南发布:AI Agent开发进入“能力模块时代”

AI 正在从“聊天系统”变成“能力系统”。在这种架构下:Skills 是能力模块MCP 是工具连接层Agent 是调度系统如果你正在做:AI Agent自动化系统MCP工具企业AI应用那么 Skills 这种能力封装方式,很可能会成为下一代 AI 工程的重要模式。

2026-03-12 11:29:15 180

原创 不会写代码也能懂:OpenClaw四层架构图解

假设你现在在飞书给OpenClaw发了一条指令:“帮我截一下卧室那台Mac的屏幕,看看程序跑完了没。交互层:飞书适配器收到消息,翻译成内部格式,传给网关。网关层:网关看消息来源,分配给“你的主会话”;同时检查有没有定时任务冲突,放进队列。智能体层:会话管理器加载你的历史记录和记忆;上下文组装器拼好提示词;大模型看完,决定调用peekaboo技能;执行循环开始跑。执行层:网关查询技能路由表,发现peekaboo需要远端节点执行,通过WebSocket把指令发给你卧室的MacBook;

2026-03-10 16:40:04 390

原创 一个人,也能跑系统:我用 OpenClaw 搭起的 20 条自动化流水线

当 AI 只是对话工具,你一直在输入。当 AI 变成系统,它开始为你运行。会议被结构化。联系人被持续追踪。决策拥有多视角分析。数据形成长期资产。一个人确实可以是一支团队。前提是—— 你开始用系统思维,而不是聊天思维。

2026-03-09 22:24:44 383

原创 OpenClaw × ListenHub 实战拆解:如何给 Agent 一键赋予语音与画图能力?

当 Agent 会说话、会画图、会自动生产音视频内容时,它就不再是聊天机器人。它是一个可扩展的生产节点。真正值得关注的,不是“多模态很酷”, 而是:如何在工程体系内,让它可控、可测试、可扩展。这才是 Agent 时代的关键问题。

2026-03-09 21:49:52 564

原创 AI系统功能测试怎么做?从“正确性断言”到“上下文边界”的测试范式转移

模型在一次对话中能“记住”的内容大小,通常以 token 计量。超过长度后,早期内容会被截断。当测试对象从“规则系统”变成“概率系统”,测试工程师的角色也随之改变。从:验证结果是否正确转向:评估系统行为是否可控。AI 功能测试,本质是在寻找:模型的能力边界、稳定区间与风险极限。这不是工具升级。这是测试范式的转移。而理解这个转移,是 AI 时代测试工程师的分水岭。

2026-03-09 21:31:56 362

原创 别再手动写用例了!未来测试设计的核心是“教AI怎么思考”

回想我刚开始带团队的时候,总要花大量时间给新人讲业务、讲设计方法、讲踩过的坑。现在,这些时间我可以用来构建一个“数字版的我”——一个理解我们团队业务、知道我们历史教训、并且不知疲倦的AI测试助手。这个过程并不轻松,它要求我把自己多年的经验拆解成清晰的逻辑和结构化的数据。但一旦做成,我从重复劳动中解放出来,可以去探索更有挑战的领域:性能瓶颈分析、全链路压测、用户体验深挖。别再手动写用例了。未来的测试设计,核心不是“写”,而是“教”。当你教会AI如何思考,你才真正从测试执行者,跃迁为测试赋能者。

2026-02-28 23:24:08 358

原创 Django 路由设计进阶:从 path() 参数到动态 URL 架构思维

Django 很“温柔”,它让新手几分钟就能跑起一个站点。但真正拉开差距的,从来不是会不会写path(),而是你是否理解路由背后的匹配机制、参数传递方式以及可扩展性设计。这一篇,我们系统梳理 Django 路由配置的核心能力,从基础匹配,到转换器,再到动态 URL 的设计与匹配顺序问题。内容不复杂,但每一个细节都是真正写项目时绕不过去的。

2026-02-28 23:16:59 451

原创 Django 精准路由匹配:从 path 到 re_path 的正则进阶

当你开始对 URL 的“精度”提出要求时,普通的path()就不够用了。如果只是匹配整数、字符串,转换器已经足够。但当需求变成:只能匹配一到两位数必须严格区分日期顺序必须精确控制匹配边界re_path这篇文章,我们系统讲清楚:为什么普通 path 不够用re_path 的匹配原理如何用命名分组传参两个完整实战案例使用 re_path 时的工程注意事项。

2026-02-28 23:13:47 343

原创 Claude Skill 官方指南发布:能力模块化正在改变大模型工程结构

在 Skill 出现之前,我们扩展大模型能力主要依赖:更复杂的 Prompt外部 Tool 调用Agent 编排流程但这些方式都存在工程问题:Prompt 不稳定 Tool 过于原子化 Agent 复杂度过高Skill 的定位,恰好在 Tool 与 Agent 之间。Tool 是操作层 Skill 是能力层 Agent 是调度层Skill 不是简单封装接口,而是:定义清晰职责约束输入输出结构明确触发条件支持组合调用这一步,本质是在为大模型建立“能力模块系统”。

2026-02-28 23:09:56 444

原创 代理编程全球第一之后:GLM-5 会不会改变自动化与 Agent 测试范式?

GLM-5 的价值,并不仅体现在参数规模或排行榜位置。真正值得关注的是:推理成本结构的改变Agent 决策稳定性的提升国产算力生态的工程适配当模型开始具备稳定的代理编程能力,它会逐步进入自动化体系核心。对从业者而言,关键问题不是模型有多强,而是:你的自动化与测试体系,是否准备好适配这种能力结构的变化。大模型的升级,往往意味着工程范式的调整。

2026-02-28 23:06:01 462

原创 OpenAI 官宣弃用 SWE-bench Verified:代码能力“金标准”为何被撤?测试工程师该关注什么

OpenAI 弃用 SWE-bench Verified,并推荐使用更严格的 Pro 版本,本质上是一次评估体系升级。对软件测试从业者而言,这件事传递出的信息比模型分数更重要:在 AI 时代,测试的不仅是系统,还包括测试标准本身。评估方法论,正在成为新的核心能力。

2026-02-28 23:05:18 475

原创 即梦 Seedance 2.0 官方使用手册发布:完整功能解析 + 下载入口

2026年2月7日,字节跳动旗下 AI 创作平台正式发布了新一代视频生成模型。这一代模型一经推出便在国内外创作圈层掀起了轩然大波——不仅因为它性能强悍,更因为它彻底改变了视频 AI 生成的玩法。过去许多 AI 视频工具靠的还是“随机抽卡”式的运气玩法,效果连贯性差、人物一致性难以控制、镜头语言也很难扎实。而 Seedance 2.0 把这个逻辑推向了全新高度。不仅支持,还能基于参考素材精准生成连贯的视频画面,并把节奏、动作、镜头语言甚至音画同步都纳入可控范畴。

2026-02-28 23:03:05 1589

原创 别让RAG成为“人工智障”:用Agent Skills做知识库检索,究竟强在哪?

写这篇文章的时候,我翻出去年那个“智能问答机器人”的代码看了看。那时候的我,满脑子想的都是“怎么把检索做得更准”“怎么把Prompt写得更好”。检索再准,也解决不了“不会思考”的问题。传统RAG像是给了AI一双好眼睛,让它能看清书上的字;而Agent Skills给了AI一个会思考的大脑,让它知道该看什么书、怎么看、看完怎么用。“Skills是专业知识的封装与传递机制”。通过Skills,AI可以继承团队的隐性经验、遵循行业的最佳实践。用Agent Skills做知识库检索,能比传统RAG效果更好吗。

2026-02-28 17:25:34 666

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除