AI系统的测试入门与实践_质问的博客-CSDN博客

AI系统的测试入门与实践

文章平均质量分 69

最近AIGC大火，那么面对任何一种的AI系统，测试工程师应该如何测试，AI系统的测试与常规系统有什么不同呢，本专栏就针对这些问题，从零开始讲解AI系统的测试。在本专栏中可以学习如何测试AI系统，如何保证AI系统的质量特性。

文章数：76 文章阅读量：85265 文章收藏量：88

作者: 质问

前京东测试架构师、阿里云MVP、华为云MVP、中国商业联合会互联网应用工作委员会智库专家、中关村智联软件服务业质量创新联盟软件测试标准化技术委员会委员、极*客时间命题专家，极*客时间《接口测试入门课》作者、《研发效能实践指南》副主编、拉钩教育《软件测试第一课》作者，NCUT软件体系结构实验室特邀企业导师、《接口测试方法论》《持续测试》《京东质量团队转型实践》图书作者、《测试敏捷化白皮书》特邀编委、《DB51T1998-2015移动智能终端应用软件(APP)产品通用技术要求及测试规范》编委、多次受邀参与TID、NCTS、MAD、MPD、TICA、DevOpsDys等技术峰会以及参出品人。

展开

AI系统的测试入门与实践

作者: 质问

MCP协议的核心机制和交互过程

使用unsloth对Qwen3在本地进行微调

Agentic Pattern ：Planning Pattern （基于Ollama、langchain、qwen3的代码实现）

Agentic Pattern ：Reflection（基于Ollama、langchain、qwen3的代码实现）

Agentic Pattern ：Parallelization(基于Ollama、langchain、qwen3的代码实现）

Agentic Pattern ：Routing（基于Ollama、langchain、qwen3的代码实现）

Agentic Pattern ：Prompt Chaining（基于Ollama、langchain、qwen3的代码实现）

一些模型测试中的BUG和可能解决方法

LLM 采样参数超详细解释

LoRA微调的一些术语：“q_proj“, “k_proj“, “v_proj“, “o_proj“, “gate_proj“, “up_proj“, “down_proj“

LLM的min_p 参数详

每一个LLM的使用者都应该能了解的超参详细说明和推荐配置

通过java 的生成接口测试jmeter的脚步

大模型格式化输出的几种方法

兼容性测试设计提示词

直接从SUT的源代码生成JMeter测试脚本的提示词

测试用例生成的Prompt

Python开发MCP Client

Python的MCP Server开发实战

大模型的UI自动化：Cline 使用Playwright MCP Server完成测试

AI IDE:Windsurf 配置Playwright的MCP Server

AI Test Reporter：让大模型帮你分析失败的Playwright测试报告

知识蒸馏：大模型智慧的传承与精炼

借助Claude实现Playwright的自动化（MCP Server）

MCP Server开发的入门教程（python和pip）

LLM的MCP协议：初识MCP，搭建第一个MCP Server

借助大模型实现精准测试未覆盖代码的接口测试用例补充设计

把一个本地工程代码整理到一个文档给大模型解读工程做基础

大模型的安全机制

DPR:一种用于开放与问答任务的检索方法

程序调用大模型返回结构化输出（JSON）

Function Calling 快速理解

LLM的幻觉验证

Retrieval-Augmented Evaluation方法评估模型幻觉

如何评价一个AI系统

成功注册Google的SerpAPI实现AI Agent的tool

LlamaIndex废弃了ParamTuner，可以用RayTuneParamTuner和AsycParamTuner替换

rest_asyncio 简化和管理异步python编程中的 REST API 调用

Ollama局域网内访问

Ollama完成本地模型的运行