hogwarts_beibei-CSDN博客

原创 DeepSeek 协议中转火了：ds2api 为什么能让一套接口同时兼容 OpenAI、Claude、Gemini？

很多协议转换项目，最容易做的是普通文本对话。原因很简单。不同模型、不同 SDK、不同客户端，对工具调用的表达方式不一样。tool_calls有的是 XML 风格。有的是消息块。有的是流式增量输出。有的是先输出工具名，再输出参数片段。如果 Tool Call 适配不严谨，模型输出可能会被当成普通文本，或者工具调用结构泄漏给用户。

2026-06-11 11:50:39 2

原创 25岁月薪1.3W，测试岗的尽头是“死路”？大厂私教：你对力量一无所知

聊到最后，我问他：“你才25岁，就算35岁是尽头，你还有10年。难道这10年不值得我们好好冲一把吗？很多人觉得测试是青春饭，但实际是，低水平的重复劳动才是青春饭。我40多岁了，依然在一线。现在的环境确实比我们当年残酷，公司愿意给新人机会，培训体系完善，但很多人推都推不动。而对于一个优秀且目标清晰的人来说，你的路只会越走越宽。从“不知道自己不知道”的盲目自信，到“知道自己不知道”的清醒焦虑，其实你已经赢了一半。剩余的一半，就是把那个模糊的目标（月入2W），拆解成一张清晰的能力地图：学历要不要补？代码量够不够。

2026-06-11 11:50:23 15

原创万字长文：如何用 harness 的理念设计一个 AI 驱动的 UI 自动化工程。

在过往文章中，其实已经介绍了很多编写 skill 的技巧，而把他们组合起来，其实就是 Harness 了。其实 Harness 没有一个业界规定好的，固定的规范，一切让智能体运行的更稳定，高效，准确的方法，其实都算作 Harness 的实践方法。所以 Harness 是一个方法论，而不是一个固定的实现规范。我在这篇文章中介绍的，也只是比较常见的一些设计技巧。角色定义是整个文件最重要的一句话。它决定了主 Agent 有没有「越权」的冲动。你是一个帮助用户写测试的 AI 助手。

2026-06-11 11:50:00 88

原创 Craft Agents 爆火：Agent 工具正在从“命令行玩具”走向“工作流系统”

Craft Agents 不是第一个 Agent 工具，也不会是最后一个。但它值得关注的地方在于：任务、会话、权限、工具、数据源、技能、自动化。这说明 Agent 正在进入一个新阶段。不是谁 Prompt 写得更花，谁就更强；不是谁接的 MCP 更多，谁就更强；不是谁能自动跑命令，谁就更强。能连接真实工作环境能沉淀团队经验和流程能在权限边界内稳定执行任务对测试开发同学来说，这个趋势尤其值得重视。未来的测试能力，不只是会写用例、会写脚本、会搭平台。

2026-06-11 11:49:36 40

原创 TradingAgents 爆火：当一个 AI 不再炒股，而是组建了一支“虚拟投研团队”

TradingAgents 的爆火，说明市场对“金融 + Agent”的关注正在升温。AI 正在从一个回答问题的工具，变成一个能参与复杂业务流程的协作系统。在这个系统里，模型不再只是输出答案。它可以扮演分析师、研究员、风控、交易员、审批人。每个角色都有边界，每次决策都有过程，每个结果都可以复盘。这才是 Agent 时代真正有价值的地方。

2026-06-11 11:49:05 30

原创【Browserbase Skills：让 Claude Code 具备浏览器自动化能力的开源框架

Browserbase Skills 开源，表面上是给 Claude Code 增加浏览器自动化能力。但从技术趋势看，它代表的是 Agent 能力边界的一次扩展。理解文本 → 生成内容 → 生成代码打开系统 → 操作页面 → 执行任务 → 记录过程 → 反馈结果这就是从“文本智能”到“操作智能”的变化。对开发者来说，它意味着 AI Coding 不再只是生成代码，而是可能逐步进入验证、调试、回归和部署前检查。

2026-06-11 11:48:42 34

原创 Claude Code / OpenClaw / Cursor Skill横向对比：哪个更实用？

最近后台被问爆了一个问题。“网上天天推送Claude Code、OpenClaw、Cursor，到底哪个更实用？我一个做自动化的，都被整懵了。一个20人的测试团队，有人用Claude Code做API自动化、接管CI流程；有人用Cursor在IDE里写脚本、调试用例；还有人已经在用OpenClaw挂了一个智能体，24小时扫描线上日志、自动报Bug。你同时看到这三个东西在不同人手里跑。但没有人能直接告诉你：我到底该学哪个？今天直接扒底层，不聊虚的。

2026-06-11 11:47:58 59

原创终端里的 DeepSeek 编程助手火了：AI 写代码，正在从聊天框走进命令行

DeepSeek-TUI 的走红，不只是一个开源项目获得了关注。从聊天框到终端从代码生成到工程执行从单次问答到持续反馈从人工复制粘贴到工具链协作对测试开发来说，这类变化尤其值得重视。因为测试开发本来就站在代码、工具、平台、流程和质量之间。当 AI 开始进入终端，进入项目，进入 CI/CD，进入自动化测试流程，测试开发的能力边界也会被重新定义。未来更有竞争力的测试开发，不一定是写代码最快的人。而是能够把 AI、自动化、测试平台、工程流程和质量体系整合起来的人。

2026-06-11 11:47:27 47

原创深夜调试：一个弹窗定位问题，暴露了90%UI自动化的通病

弹窗是动态渲染的组件。普通的页面元素，页面加载完就存在了。但弹窗不同——它是在用户点击某个按钮后，才被JavaScript动态创建出来。如果你在弹窗还没完全渲染完成时就去定位元素，WebDriver自然找不到。这也是为什么UI自动化中，弹窗、下拉框、树形菜单这类组件最容易出问题。它们不是“天生”就在页面上的，而是“后天”长出来的。应对这类场景，除了精准定位，还需要配合显式等待，直到元素真正可操作为止。这一小时的私教服务，解决的不仅是一个“元素覆盖”的报错。UI自动化的核心难点。

2026-06-11 11:47:11 28

原创终端里的 DeepSeek 编程助手火了：AI 写代码，正在从聊天框走进命令行

DeepSeek-TUI 的走红，不只是一个开源项目获得了关注。从聊天框到终端从代码生成到工程执行从单次问答到持续反馈从人工复制粘贴到工具链协作对测试开发来说，这类变化尤其值得重视。因为测试开发本来就站在代码、工具、平台、流程和质量之间。当 AI 开始进入终端，进入项目，进入 CI/CD，进入自动化测试流程，测试开发的能力边界也会被重新定义。未来更有竞争力的测试开发，不一定是写代码最快的人。而是能够把 AI、自动化、测试平台、工程流程和质量体系整合起来的人。

2026-06-11 11:46:53 30

原创一套Skills库干掉30%手工测试，老板已经在问了

上个月技术复盘会，老板突然问了一个让所有测试组长后背发凉的问题：“听说隔壁团队搞了一套什么Skills库，手工测试量直接砍掉30%？我们什么时候也能这样？会议室安静了三秒。没人敢接话。因为大家心里清楚，自己团队还在手工点来点去，偶尔写几个半自动脚本。隔壁的“Skills库”三个字，像一根刺扎在每个人心里。会后我专门去聊了一下。隔壁测试负责人很坦诚：不是什么黑科技。就是把团队最常做的20个手工操作，写成了AI能调用的Skill。

2026-05-27 10:55:47 133

原创百度面试官一针见血：“多模态RAG，图片里的文字你OCR出来了，那图里的逻辑关系呢？”我沉默了

上个月百度招一个AI测试开发岗，我面到第三轮，面试官忽然从手机里翻出一张截图递给我看。是一张典型的业务流程图。左边三个圆角矩形写了“用户上传”“系统校验”“返回结果”，中间三条箭头，其中一条从“系统校验”指向一个菱形判断框“信息完整？”，分两支：是→“存入数据库”，否→“驳回”。面试官问：你用多模态RAG做文档问答，用户传这张图问‘上传后信息不完整会怎样’，你觉得你的系统能答对吗？我下意识说：OCR能提取出‘信息完整？

2026-05-27 10:55:37 118

原创我花一周拆解了企业级Skills库的全套设计模式

你团队现在跑的几百个测试脚本里，哪些适合抽象成 Skill，哪些天生就不适合 Agent 调用？如果你还没开始问这个问题，一年后这些脚本大概率会变成没人维护的技术债。而能够回答这个问题的人，已经在构建下一个周期的测试基础设施了。

2026-05-27 10:55:26 132

原创 “我35岁，年薪50万，却觉得自己是个‘废人’”

一个小时的对话快结束时，小J提到了一个“B计划”：“要不，我去读个博？老师笑了，但很认真地说：“读博的机会成本太高了。脱产四五年，断了收入，出来40岁，那时的就业市场谁也说不好。除非你真的热爱学术，否则不要用它来逃避职场的焦虑。这段对话的核心，其实是小J想向老师要一个“确定性”——一个能让她不害怕、不心虚的未来。没有人能给你确定性，但行动可以。趁着还有工作，心理不慌，去面试。面试是检验能力最好的“照妖镜”，也是了解市场需求的捷径。

2026-05-27 10:54:41 288

原创字节面试官追问：“你的Agent调了三个工具就死循环了，异常处理在哪写的？”我：啊？还要写这个？

以前问的是“Selenium怎么定位元素”，后来问“接口自动化框架怎么设计”。那一刻，空气突然安静。这不是段子，这是2026年测试工程师面试的真实切片。当你还在用AI生成脚本的时候，大厂已经在考察你了。

2026-05-27 10:54:28 10

原创浏览器自动化的下一层：为什么 CloakBrowser 把指纹问题推到了源码层？

CloakBrowser 受到关注，不只是因为它宣称通过了多项检测，也不只是因为它能替换 Playwright。更重要的是，它暴露了一个趋势：浏览器自动化正在进入更深的技术层。过去我们讨论自动化，更多讨论脚本、定位、断言、并发、报告。现在我们必须讨论浏览器内核、指纹一致性、网络时序、行为模型、环境画像、供应链安全和风控测试。对测试开发来说，这不是简单多学一个工具，而是要意识到：未来的自动化能力，不再只是“我能不能点到按钮”。

2026-05-27 10:53:57 267

原创 Anthropic 开源 Skills：Agent 工程化，开始从 Prompt 走向能力封装

最近，Anthropic 开源了一个很值得关注的项目：。从仓库 README 来看，这个项目不是简单放了一批 Prompt 模板，而是把 Claude 使用的一套 Agent Skills 能力机制开放出来，里面包含技能示例、规范、模板，以及文档处理相关的复杂 Skill 参考实现。简单说，Skills 的目标是：让 Agent 在面对特定任务时，可以动态加载一组已经封装好的说明、脚本和资源，从而更稳定地完成任务。这件事对做 Agent、做 AI 工具、做智能化测试的人来说，都值得看一下。因为很多团队现在遇

2026-05-27 10:53:45 299

原创 AI 编程不缺代码能力，缺的是这套 Agent Skills 工程能力库

Agent Skills 的走红，不只是一个开源项目的热度变化。AI 编程正在从 Prompt 阶段，进入工程流程阶段。过去大家比的是：谁的 Prompt 写得好；谁能让 AI 生成更多代码；谁能更快做出 Demo；谁能用 AI 提升个人效率。但接下来，真正拉开差距的会是：谁能把工程经验沉淀成流程；谁能把质量标准变成门禁；谁能让 AI 输出可验证证据；谁能把开发、测试、评审、发布串成闭环；谁能让 Agent 在复杂项目里稳定工作。对测试开发来说，这个变化尤其重要。

2026-05-27 10:47:46 369

原创 Claude Code 用了两周后，我发现它最强的不是写代码

Claude Code 的出现，说明 AI 编程正在发生一个变化。过去大家关心的是：AI 能不能写代码；AI 能不能补全函数；AI 能不能解释报错；AI 能不能生成脚本。现在更应该关心的是：AI 能不能理解项目；能不能遵守团队规范；能不能参与测试闭环；能不能看懂 diff；能不能管理上下文；能不能在权限边界内执行任务；能不能把开发、测试、提交、复盘串起来。这才是 Claude Code 值得学习的地方。它不是让工程能力变得不重要。恰恰相反，它会放大工程能力的差距。

2026-05-27 10:47:19 361

原创写了那么多 AI 测试 Skills，为什么还是不好用？

这是测试 Skills 最核心的坑。请生成完整测试用例。问题是，什么叫完整？对 AI 来说，可能包含 5 条用例就算完整。正常路径异常路径边界值权限状态流转幂等性重复提交并发数据一致性错误码降级逻辑安全风险性能风险如果你不定义覆盖标准，AI 就会默认生成最常见、最省事的用例。## 测试覆盖要求每个接口至少从以下维度设计用例：1. 正常场景：合法参数、正常状态、预期成功。2. 必填校验：必填字段为空、缺失、null。3. 类型校验：字段类型错误、数组/对象结构错误。

2026-05-27 10:46:52 363

原创 Cursor 把内部代码审查工具放出来了，AI 写代码之后，质量风险变了

Cursor Team Kit 这类工具出现，说明一件事：AI 编程进入团队流程以后，研发效率会继续提升，但质量治理也必须跟着升级。以前测试主要面对的是人写代码带来的问题。以后测试还要面对 AI 生成代码带来的问题：代码生成很快；改动范围更大；重复逻辑更隐蔽；复杂度堆积更快；可维护性更容易被忽略；自动化资产更容易被频繁冲击。这不是说 AI 编程不好。恰恰相反，AI 会让研发效率提升很多。但效率提升以后，团队更需要质量门禁。否则代码写得越快，测试后面接得越累。

2026-05-26 16:15:13 9

原创高质量测试 Skill 编写手册 -- 渐进式披露

渐进式披露是高质量 Skill 中最基础也最重要的技巧之一。不要把所有的规则和知识都一股脑的写在提示词中交给大模型，而是只在必要的时候，加载对应的知识。

2026-05-26 16:13:53 139

原创私教服务 | “我学了，但不会用”：一个测试人的迷茫与破局之路

这段私教对话其实没有给出什么“神奇的方法”。老师没有说一句学员听不懂的高深理论。把大问题拆小，把模糊的地方变具体。你说迷茫 → 那我们找一个具体的抓手你说不知道写什么 → 那就先复现课程里的案例你说怕没价值 → 先练习，再看价值你说想追AI → 先把基础打牢技术学习没有捷径，但有路径。从“看懂”到“写出来”，中间隔着一万次敲击键盘。不是天赋的问题，是次数的问题。对话快结束时，老师说了一句很坦诚的话：“可能我今天能帮你的确实不多，你还是跟着以前的课程重新学一遍吧。别翻得太快，别简单敲两下就完事。

2026-05-26 16:12:41 115

原创从模型、Agent 到 MCP：这个 10.7k Star 项目，把 AI 工程学习路线重新铺了一遍

这个项目值得关注，不是因为它把 AI 知识点列得很全，而是因为它的组织方式很工程化。它没有停在“知道一个概念”，而是要求你：把算法写出来把代码跑起来把结果测出来把能力封装起来把组件交付出去这套方式和测试开发的工作习惯是接近的。测试开发真正要补的，也不是“多背几个 AI 名词”，而是把下面几件事想清楚：AI 系统的输入边界在哪里 AI 系统的输出如何验证 AI 系统的执行过程如何观测 AI 系统的失败如何定位 AI 系统的质量如何度量 AI 系统的能力如何沉淀到团队工具链里。

2026-05-26 16:11:08 130

原创 AI短视频爆火新玩法：一套提示词，1分钟复刻电影名场面！（附完整模板）

如果你：想做自媒体想做AI副业想提升内容生产效率想用AI实现自动化创作《自媒体与AI自动变现训练营》AI正在改变内容行业。未来的创作者拼的不是拍摄能力。AI生产力。会用AI的人，正在重新定义自媒体。

2026-05-26 16:10:42 402

原创免费用openclaw小白白嫖教程，一键安装小龙虾，无限token，再也不用担心用不起了

打开https://oneclaw.cn/ 根据你的系统，选择对应的版本下载安装即可！此版本无需命令行，一键安装，1 分钟上手！

2026-05-26 16:09:53 134

原创私教服务 | “别一上来就撸测试平台，先想清楚这3个问题”

这一场私教咨询，前后不到二十分钟。但我觉得，这二十分钟可能帮他省下了两三个月的弯路。想做的东西太大，而自己的基础撑不起来。结果就是反复受挫，信心一点点被磨掉。正确的姿势是什么？从小处着手，从能跑通的第一行代码开始。不要一上来就想撸一个测试平台。你先做一个能发HTTP请求的脚本，再做一个能解析Excel用例的工具，再做一个简单的Web页面让你选择接口、填写参数。每一步都跑通，再往上叠加功能。平台不是设计出来的，是长出来的。先走这一步，别急着跳。

2026-05-26 15:52:26 259

原创私教服务 | “测试做了好几年，代码还是不行，怎么办？”

快要挂电话的时候，他忽然说：“我一直在找一个工具，之前上课的时候老师介绍过，可以把业务流程画成那种……每一步请求什么、返回什么，特别清晰的那个……叫什么来着？“流程图？时序图？“不是不是……一时想不起来了。“没关系，”我说，“工具叫什么不重要。重要的是，你脑子里有没有那个结构。画图是为了帮你思考，不是为了画图本身。他沉默了一下。“其实……”他说，“我今天最大的收获不是Postman能生成代码，也不是Airtest怎么用。是我终于知道自己缺什么了——不是缺工具，是缺一个方向。

2026-05-26 15:49:11 342

原创企业内训丨AI 正在重构软件测试体系，企业该如何把“智能化测试”真正落地？

软件测试正在进入新的阶段。过去，企业关注的是自动化覆盖率、脚本稳定性和执行效率。现在，企业更需要关注：AI 如何理解业务？AI 如何生成测试策略？AI 如何调用自动化工具？AI 如何完成缺陷溯源？AI 如何评测另一个 AI 系统？AI 如何成为企业质量保障体系的一部分？这背后不是单个工具的变化，而是测试体系、测试平台、测试流程和测试人才能力模型的整体升级。

2026-05-26 15:47:42 370

原创私教服务 | 一场差点吵起来的测试环境搭建咨询，暴露了90%测试人的认知盲区

测试环境搭建的困境与专业解决方案：一场真实的技术咨询实录揭示了测试团队面临的典型挑战。咨询中暴露了性能测试环境搭建的关键要点（环境隔离、硬件配置、数据模拟等），以及预发布环境与生产环境一致性的必要性。咨询师提供了专业建议：数据应基于生产样本模拟扩量，预发布环境需保持配置一致但数据隔离。文章还探讨了测试团队中长期规划框架（业务交付、技术创新、行业影响力），并强调专业能力体现在技术决策和沟通能力上。这场咨询凸显了测试环境一致性背后的技术、成本和话语权问题。

2026-05-26 15:34:16 381

原创性能测试进阶秘籍：如何用JMeter分布式压测挖掘系统极限潜能

《突破单机压测瓶颈：JMeter分布式压测实战》针对单机压测遇到的性能瓶颈问题，详细介绍了JMeter分布式压测解决方案。文章分析了单机压测的物理限制原因，对比了JMeter与Locust工具的特点，并提供了从需求定义到脚本设计的完整压测指南。重点讲解了JMeter分布式架构的实现要点，包括Master-Slave配置、Ansible自动化管理、参数化设计等核心技巧，以及分布式压测的具体实施步骤。通过分布式方案可有效突破单机性能限制，为高并发测试提供可靠支持。

2025-11-07 01:00:00 638

原创让AI帮你跑用例-重复执行，不该成为测试工程师的主旋律

而智能体的出现，让这一切都变得更流畅，它不依赖固定脚本，而是能根据用例意图动态规划执行，它能识别执行异常、自动重试，它能精准断言用例执行结果、提供清晰的步骤截图及详细的日志。于是，测试工程师被“机械的执行”牢牢绑住，想去优化用例、分析缺陷模式、设计自动化框架的时间被一点点挤压。测试周期被拉长，交付节奏被拖慢，重复劳动占据了宝贵的人力资源，而真正能推动质量体系进步的创新性工作，却被迫让位。对测试工程师来说，通过与AI协作，你可以从重复执行中彻底解放，专注更具创造力的工作；你要报告，AI智能体直接生成。

2025-11-07 00:30:00 695

原创 Cypress 插件实战：让你的测试不再“偶尔掉链子”

如果你在做端到端测试，经常会遇到这些情况：页面动画、微调器挡住按钮，cy.click()报错GraphQL / REST 数据异步加载，元素还没渲染网络请求偶尔慢或重复触发cy.wait(500) // 等半秒再操作问题测试慢易失败调试困难盲目等待不如智能等待。插件可以让测试像“人眼”一样，等页面真正稳定再操作。});小项目可以用，但逻辑无法跨项目复用，且仅能操作浏览器端。cy.log(`登录用户 ${username}`);});

2025-11-06 15:05:19 688

原创有了 MCP，为啥 Claude 还要推出 Skills？一文带你搞懂它到底强在哪? MCP 有啥区别、该怎么用！

Claude推出的Skills功能将AI能力模块化，通过预装插件实现特定任务的快速执行。Skills包含说明书、脚本模板和资源文件，能按需加载完成Excel处理、PPT制作等标准化工作。与MCP（连接外部系统的协议）不同，Skills专注于任务执行，两者结合可形成"模块执行+系统联动"的解决方案。官方测试显示Skills使任务效率提升40%，错误率降低35%，12个开源示例已覆盖常见办公场景。该功能预演了AI工程化的未来趋势：从Prompt竞争转向模块化能力复用。

2025-11-06 15:04:41 3713 2

原创面试性能测试总被刷？学员真实遇到的高频问题全解析！

本文解析性能测试面试的核心要点，指出企业真正考察的是系统分析能力而非工具操作。文章强调性能测试的关键在于监控、分析和优化能力，建议通过实战项目掌握JVM/MySQL调优等技能。训练营课程提供全流程实战，帮助学员从"会工具"进阶到"能分析解决问题"。最后提出性能测试工程师的成长路径，建议用数据证明能力，实现从理论到实践的跨越。

2025-11-06 15:04:05 1030

原创必备性能测试面试题解析 | 高并发与瓶颈分析

【摘要】本文系统梳理性能测试核心知识点，针对电商大促等高并发场景提供解决方案。重点解析5大性能瓶颈（CPU、内存、数据库、网络、架构），结合双11秒杀等真实案例说明分层分析方法。详细介绍JMeter高级特性、性能指标（响应时间/TPS/QPS）及测试设计流程，特别强调面试中需展示问题定位与优化能力。针对典型异常场景（如并发增加但TPS不升）给出诊断思路，推荐主流测试工具链（JMeter/Prometheus/SkyWalking等）。文章通过可视化流程图呈现完整测试链路，帮助测试人员构建系统性思维，提升面试

2025-11-06 15:03:31 579

空空如也

空空如也