小赖同学啊
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
AI时代 越狱攻击(Jailbreak)和事实性幻觉检测(Factual Hallucination)**
选择 越狱攻击(Jailbreak) 和 事实性幻觉检测(Factual Hallucination) 这两个领域是AI安全测试中最前沿、最需要深度技术积累的部分。二、完整越狱测试框架实现第二部分:事实性幻觉检测深度展开三、事实性幻觉检测完整实现四、完整测试运行示例📊 总结模块核心功能关键指标输出越狱攻击管理器16种越狱变体成功率、风险等级、绕过护栏详细攻击报告事实性幻觉检测器实体验证、关系验证幻觉率、严重程度幻觉定位与证据时序一致性原创 2026-06-24 09:44:47 · 290 阅读 · 0 评论 -
深入展开 LLM幻觉测试 和 对抗攻击测试
深入展开 LLM幻觉测试 和 对抗攻击测试 这两个AI测试中最核心、也最考验技术深度的领域。我会给出完整的、可直接运行的代码实现。二、完整实现代码2.1 基础幻觉检测框架2.2 幻觉测试套件第二部分:对抗攻击测试(Adversarial Testing)一、对抗攻击类型二、完整实现代码2.1 对抗攻击框架2.2 对抗攻击测试套件第三部分:集成与使用三、完整的测试运行器📊 总结:幻觉测试与对抗攻击测试对比维度幻觉测试对抗攻击测试目标检测模型生原创 2026-06-24 09:40:09 · 17 阅读 · 0 评论 -
AI时代测试工程师的核心价值和战略定位
AI时代测试工程师的核心价值和战略定位。我们将从两个维度展开:二、各阶段AI具体实现方案2.1 需求阶段:AI辅助需求分析与测试估算场景:产品需求文档(PRD)通常有几十页,人工梳理测试点耗时且容易遗漏。AI实现方案:提效数据:场景:根据需求文档和代码变更,自动生成高覆盖率的测试用例。AI实现方案:使用示例:2.3 执行阶段:AI智能测试执行场景:测试脚本自动生成、自动修复、智能等待。AI实现方案:2.4 分析阶段:AI缺陷分析与质量预测第二部分:AI产品的软件测试策略一、AI产原创 2026-06-24 09:36:54 · 259 阅读 · 0 评论 -
集成 Docker容器化部署 和性能监控集成到企业级框架中
集成和这两个能力,无缝嵌入到你上一篇文章提到的企业级框架中。我们采用业界成熟的技术栈,实现“测试即容器、性能即视图”。原创 2026-06-24 09:31:46 · 20 阅读 · 0 评论 -
企业级全功能自动化测试框架-六层架构 + 四大引擎
设计一个企业级全功能自动化测试框架。六层架构 + 四大引擎。完整项目结构一、核心引擎层(完整实现)1.1 驱动引擎(core/engines/driver_engine.py)1.2 接口引擎(core/engines/api_engine.py)1.3 数据库引擎(core/engines/db_engine.py)1.4 报告引擎(core/engines/report_engine.py)二、工具层(完整实现)2.1 失败重跑器(utils/retry.py)原创 2026-06-24 09:27:38 · 31 阅读 · 0 评论 -
AI时代,软件自动化可执行的实例
好,我把上一轮那个“周一就能干”的练习清单,串成一个。你跟着做一遍,就能把那些技能全练到手。原创 2026-06-24 09:13:27 · 170 阅读 · 0 评论 -
AI时代 软件测试行业升值必备技能
在AI时代,软件测试行业最核心的变化,是从“验证功能”转向“保障不确定系统的可靠性与可信赖性”。(基础)、(进阶),以及(高阶)。原创 2026-06-24 09:08:23 · 17 阅读 · 0 评论 -
大模型项目软件测试:技术方案与实施路径
阶段测试模式核心能力传统手工用例 + 确定性断言功能点覆盖过渡AI辅助生成 + 人工审核效率提升目标Agent驱动 + 自适应演化质量边界探索大模型测试的行业分水岭已经出现——不是会不会自动化,而是会不会用AI做自动化。测试工程师的角色正从“用例编写者”向“测试场景设计师”转变,核心能力升级为:评估框架选型、自动化对抗测试设计、成本可观测体系构建。如需针对具体模型类型(如对话Agent、代码生成、RAG)的详细方案,可进一步展开说明。原创 2026-05-08 10:04:43 · 74 阅读 · 0 评论 -
对话Agent、代码生成、RAG 专项测试详细方案
场景自动化程度开源工具成熟度业界基准存在落地建议代码生成⭐⭐⭐⭐⭐极高(BigCode标准)直接采用RAG⭐⭐⭐⭐中高(Ragas, Azure AI)基础性、正确性需适配业务对话Agent⭐⭐⭐中(Sensei, SDialog)任务完成率需较多定制核心趋势:代码生成测试最成熟,RAG测试框架正在完善,对话Agent测试是当前研究热点。建议优先以代码生成为试点,再逐步扩展至RAG和对话Agent场景。原创 2026-05-08 10:02:07 · 184 阅读 · 0 评论 -
AI测试的技术范式变革
架构先行:采用Agent + MCP + Skills三层架构,而非零散接入多个Agent闭环自愈:建立“生成→执行→分析→修复”的反馈循环,无效测试可减少60%指标驱动:用例采纳率、自动修复成功率等量化指标指导优化方向人机协同:AI负责执行与生成,人类聚焦策略与治理一句话总结:测试工程师的核心能力正从“写脚本”转向“架构设计、能力拆分、指标建模、治理控制”——这才是AI时代质量保障的真正竞争力。原创 2026-04-03 11:25:57 · 89 阅读 · 0 评论 -
Ragas与LangChain是目前RAG开发与评测中最主流的组合之一(带实例和指标分析)
维度说明关系定位LangChain是构建框架,Ragas是评测框架,二者互补集成方式+ LangSmith深度集成核心价值让RAG开发从“凭感觉调参”走向“指标驱动”生产就绪可集成到CI流水线,作为质量门禁# 包装LangChain模型# 传入evaluatedataset,指标评估对象所需字段核心作用生成质量检测幻觉生成质量评估切题程度检索质量衡量检索精度检索质量衡量检索覆盖率RAGAS 的评估指标将复杂的质量判断拆解为可量化、可复现的数学公式。原创 2026-04-03 10:59:54 · 169 阅读 · 0 评论 -
测试智能体系统技术实现方案
本方案采用构建多智能体协作系统,实现从需求解析到测试用例生成的完整自动化流程。fill:#333;important;important;fill:none;color:#333;color:#333;important;fill:none;fill:#333;height:1em;输出层智能体集群输入层自然语言需求需求解析Agent用例设计Agent代码生成Agent验证Agent测试用例文档可执行脚本创建import os# 初始化LLM(使用GPT-4或DeepSeek)原创 2026-04-03 10:52:29 · 113 阅读 · 0 评论 -
测试智能体(Testing Agent)为核心,融合生成式AI、多智能体协作等技术
这个电商购物车测试实例展示了测试智能体集群需求解析智能体→ 将自然语言转化为结构化测试点用例设计智能体→ 覆盖正常/边界/异常/组合场景代码生成智能体→ 自动输出可执行测试脚本验证智能体→ 执行测试、分析结果、提供评审这一范式已在多个真实系统(腾讯AI智测平台、MetaGPT RealDevWorld、微软Critique等)中得到验证,标志着软件测试正从"自动化脚本"演进为"智能体自主协作"。原创 2026-04-03 10:50:01 · 275 阅读 · 0 评论 -
企业级大模型测试的可落地、分阶段流程
企业大模型测试需遵循「准备→功能→非功能→验收」的全流程,核心是量化指标+场景化验证+生产级保障;功能测试聚焦「业务准确性」,非功能测试聚焦「安全/性能/成本」,两者缺一不可;测试不是一次性工作,需在灰度上线后持续监控、迭代优化,确保模型符合企业生产要求。原创 2026-01-06 16:15:42 · 139 阅读 · 0 评论 -
Python+requests实现的接口自动化中引入AI
你希望在Python+requests实现的接口自动化中引入AI,核心是让AI完成「测试用例生成、请求参数智能校验、响应结果自动断言、缺陷智能分析」等工作,替代人工编写固定脚本的重复劳动。以下是完整的代码级实现方案,以电商订单接口为例,从0到1落地AI驱动的接口自动化。新建文件,配置OpenAI API密钥:原创 2026-01-06 16:11:25 · 152 阅读 · 0 评论 -
借助 LangGraph 对 Agent 进行测试
LangGraph 的状态流(Stateful Flow)特性使其成为测试复杂 Agent 系统的理想工具,尤其适用于需要模拟多轮交互、上下文依赖或动态决策的场景。流程控制:用节点(Node)和边(Edge)模拟 Agent 的行为路径,支持条件分支。包含 Agent 的内部状态(如记忆、知识库)和测试环境状态(如历史对话、用户画像)。状态管理:通过 State 对象跟踪 Agent 的内部状态(如记忆、知识库)。动态决策:Agent 的行为需根据状态变化(如用户输入、环境反馈)动态调整。原创 2025-06-09 17:48:18 · 637 阅读 · 0 评论 -
UI自动化测试中,一个完整的断言应所需要考虑的问题
在UI自动化测试中,一个完整的断言应全面覆盖用户界面(UI)的功能性、交互性和视觉正确性。通过覆盖上述内容,可构建健壮的UI自动化测试套件,有效捕获80%以上的界面层缺陷。需根据项目实际需求灵活调整断言范围和深度。原创 2025-05-16 12:49:59 · 328 阅读 · 0 评论 -
接口测试无token的解决办法
场景解决方案适用阶段验证接口鉴权机制直接调用接口检查 401 响应安全性测试自动化测试需要 Token通过登录接口动态获取功能测试/回归测试测试环境特殊需求配置 Mock Token 或关闭鉴权开发/测试环境性能测试使用 Client Credentials 模式压力测试通过合理选择方案,既可验证接口安全性,又能保证自动化测试的顺利执行。建议优先采用动态获取 Token 的方式,既保证测试真实性,又避免安全风险。原创 2025-05-15 08:02:44 · 379 阅读 · 0 评论 -
基于 Python Requests + Pytest + Allure 构建接口自动化测试框架的最优实践
分层设计:数据层、业务层、用例层分离代码复用:通过 fixture 和工具类减少重复代码防御式编程:所有网络请求添加超时和重试机制版本兼容:使用锁定依赖版本文档同步:测试代码与 API 文档保持同步更新通过以上架构设计和技术实践,可构建出高可用、易维护的测试框架,满足企业级接口自动化测试需求。建议根据项目实际情况选择合适的功能模块进行组合,持续优化测试策略。原创 2025-05-15 07:34:06 · 455 阅读 · 0 评论 -
装饰器(Decorator)和lambda函数(Lambda)是两种强大的工具
print(add(5, 3)) # 输出: 8结合使用装饰器和Lambda函数你可以将Lambda函数用作装饰器内部的简单逻辑处理,或者在某些情况下直接定义装饰器为Lambda表达式。不过,通常建议使用常规函数定义装饰器,因为这样代码更清晰、更易于理解。但如果你只是需要一个非常简单的装饰器,可以使用Lambda表达式。示例:结合使用Lambda和装饰器”)或者,使用Lambda直接定义一个简单的装饰器:@decorator”)原创 2025-05-15 07:27:24 · 102 阅读 · 0 评论 -
查找两张表中通过 id 关联但没有交集的数据
要查找两张表中通过id关联但没有交集的数据(即LEFT JOIN。原创 2025-05-15 07:21:18 · 169 阅读 · 0 评论 -
Python接口测试多维度方法验证接口数据的正确性和检测数据变动
构建验证体系,并结合持续集成实现每日自动巡检。原创 2025-05-15 07:04:12 · 279 阅读 · 0 评论 -
pytest多种断言类型封装为自动化断言规则库
3f。原创 2025-05-15 06:58:11 · 489 阅读 · 0 评论 -
接口测试中,完整的断言应覆盖
在接口测试中,完整的断言应覆盖接口响应的多个维度。原创 2025-05-15 06:43:33 · 137 阅读 · 0 评论 -
Cursor(AI代码生成)、MCP(浏览器底层协议)与 Playwright(现代自动化框架)
创建一个Playwright脚本,访问https://example.com,拦截所有图片请求并统计数量,使用CDP协议”等场景中优先采用此方案。Playwright脚本。原创 2025-05-13 13:03:20 · 662 阅读 · 0 评论 -
Cursor 编辑器 的 高级使用技巧与创意玩法
和。原创 2025-05-13 13:00:14 · 508 阅读 · 0 评论 -
Cursor 配置 Browser MCP(基于浏览器底层协议控制)及浏览器插件安装
以下是针对Browser MCP 在此上下文中指通过实现与 Cursor 的深度集成。92229222。原创 2025-05-12 12:30:00 · 1873 阅读 · 0 评论 -
基于 Cursor(AI代码生成) + MCP(浏览器底层协议控制) + Playwright(现代自动化框架)
搭建基于的Web自动化测试体系后,实际体验呈现出明显的的特点。原创 2025-05-13 15:15:00 · 1080 阅读 · 0 评论 -
基于 Cursor + 浏览器MCP服务 实现 Web端自动化测试
创建一个Python测试用例,使用Puppeteer打开chrome浏览器,访问https://example.com,在搜索框输入’AI testing’并点击搜索按钮,最后截图保存。,特别是在动态Web应用和复杂交互场景中,AI辅助的协议级控制能显著减少脚本维护成本。“测试用户登录后添加商品到购物车,使用优惠码结账,需验证订单总价是否正确。集成Resemble.js或Applitools,通过AI对比页面截图差异。基于历史测试日志,AI预判可能失败的操作路径并提前加固。原创 2025-05-12 11:45:00 · 1719 阅读 · 0 评论 -
Selenium Grid 分布式执行 的详细解析
定义:Selenium 官方提供的分布式测试框架,允许在多台机器(物理/虚拟/容器)上并行运行浏览器实例,支持跨平台、跨浏览器的自动化测试。目标✅ 并行执行测试用例,缩短整体测试时间✅ 集中管理多环境(不同浏览器、版本、操作系统)的测试资源✅ 无缝集成到 CI/CD 流程,支持大规模测试套件。原创 2025-04-19 10:45:00 · 266 阅读 · 0 评论 -
pytest全部知识点,看这篇文章就够了
【代码】pytest全部知识点,看这篇文章就够了。原创 2025-04-18 11:05:58 · 285 阅读 · 0 评论 -
Allure测试报告按测试终端和测试类型智能分类查看
【代码】Allure测试报告按测试终端和测试类型智能分类查看。原创 2025-04-18 17:45:00 · 140 阅读 · 0 评论 -
自动化测试代码更新后,要更新容器里的代码
如果项目使用了 CI/CD 工具(如 Jenkins、GitLab CI/CD 等),可以配置自动化流程,当代码更新时自动重新构建镜像并部署新容器。若你不想每次代码更新都重新构建镜像,可以采用数据卷挂载的方式,将主机上的代码目录挂载到容器内。这样主机上的代码更新后,容器内的代码也会随之更新。当代码更新并推送到 GitLab 仓库时,CI/CD 流程会自动触发,重新构建镜像并部署新容器。在主机上对自动化测试代码进行更新,由于使用了数据卷挂载,容器内的代码会自动更新。选项用于指定新镜像的标签,原创 2025-04-20 08:00:00 · 153 阅读 · 0 评论 -
自动化测试实现容器化部署
通过以上步骤,可实现自动化测试的快速容器化部署,显著提升测试环境一致性和CI/CD流程效率。原创 2025-04-22 14:45:00 · 190 阅读 · 0 评论 -
App自动化测试多设备并行执行方案
通过设备池动态管理设备信息,自动分配可用设备。设备1: Android。:避免设备间操作干扰。原创 2025-04-23 20:45:00 · 177 阅读 · 0 评论 -
自动化测试代码跨系统路径适配方案
替换所有硬编码路径为修改后(跨平台):统一使用进行文件操作创建目录:步骤二:采用库(Python 3.4+推荐)路径对象化处理跨平台路径操作示例写入文件:步骤三:环境敏感的配置管理通过环境变量区分系统配置文件模板(如)步骤四:CI/CD流程适配(Jenkins示例)Jenkinsfile配置多平台测试参数化路径传递步骤五:验证与调试本地模拟Linux环境日志中添加路径信息自动化检查脚原创 2025-04-23 13:45:00 · 551 阅读 · 0 评论 -
PC自动化测试高度封装架构与实现方案
Allure报告系统。原创 2025-04-23 11:15:00 · 200 阅读 · 0 评论 -
App自动化测试流程方案与架构设计
Allure报告系统。原创 2025-04-19 12:00:00 · 200 阅读 · 0 评论 -
AI驱动测试实现的价值、流程图及核心挑战分析
AI驱动测试的核心价值在于**“自动化+智能化”**,但需解决数据、泛化、协作、集成四大挑战。原创 2025-04-09 08:45:00 · 234 阅读 · 0 评论 -
AI驱动自动化测试的不足与改进方向
通过持续优化,最终实现测试过程的"自主化":系统能够根据变更自动设计、执行、优化测试策略,仅需人工进行关键决策复核。AI测试技术演进路线。原创 2025-04-08 17:18:32 · 319 阅读 · 0 评论
分享