大厂测试人亲测：大模型自动生成测试用例，效率飙升50%！

最新推荐文章于 2025-04-15 16:53:56 发布

测试那些事

最新推荐文章于 2025-04-15 16:53:56 发布

阅读量1.7k

点赞数 21

分类专栏：程序员职场经验软件测试文章标签：测试用例自动化测试职场经验软件测试 python 职场和发展程序员

本文链接：https://blog.csdn.net/m0_56736369/article/details/139359856

版权

程序员同时被 3 个专栏收录

1028 篇文章

订阅专栏

软件测试

961 篇文章

订阅专栏

职场经验

150 篇文章

订阅专栏

今天我们一起学习讨论一个“老生常谈”但却值得不断去研究的话题，那就是“基于大模型如何生成测试用例，是否能真的提升测试效率”！据京东零售团队研究发现，基于Langchain生成测试用例，结果效率提升了50%！

我们今天就来从研究背景、实现的过程思路、实践效果以及大模型自动生成的优缺点方面来学习讨论，希望对你有所启发！

什么是Langchain

它是一个开源框架，用于构建基于大型语言模型（LLM）的应用程序。LLM 是基于大量数据预先训练的大型深度学习模型，可以生成对用户查询的响应，例如回答问题或根据基于文本的提示创建图像。

LangChain 提供各种工具和抽象，以提高模型生成的信息的定制性、准确性和相关性。例如，开发人员可以使用 LangChain 组件来构建新的提示链或自定义现有模板。LangChain 还包括一些组件，可让 LLM 无需重新训练即可访问新的数据集。

研究背景

在研究开源框架LangChain之前，公司最先普及的是JoyCoder，但是在把相关需求及设计文档信息拷贝到JoyCoder，让其生成测试用例时，却发现人工操作步骤较多（如：复制粘贴文档，编写提示词，拷贝结果，保存用例等）、响应时间久，而且当需求或设计文档内容较大时，提示词太长或超出 token 限制！

因此开展了基于LangChain的研究！

实现过程思路

整体流程图

技术解析

PDF内容解析：本次研究中选取的是PDF库中的PyMuPDF，主要是因为功能全面且处理速度快；
文件切割处理：这块相比JoyCoder，将文件分为各个小文本，就很好的解决了模型响应时间久或超出token 限制；
Memory 的使用：这个是大多数大模型都会有的一个功能，就像我们平常在使用的ChatGPT、Kimi等聊天，不需要把每次上面的内容都重复再输入一遍，大模型会自动记忆我们上述的对话内容。

本次我使用Langchain的ConversationBufferMemory与ConversationSummaryBufferMemory来实现，将需求文档和设计文档内容直接存入 Memory，可减少与大模型问答的次数（减少大模型网关调用次数），提高整体用例文件生成的速度。ConversationSummaryBufferMemory 主要是用在提取“摘要”信息的部分，它可以将将需求文档和设计文档内容进行归纳性总结后，再传给大模型。
向量数据库： 利用公司已有的向量数据库[测试环境 Vearch]，将文件存入。在创建数据表时，需要了解向量数据库的检索模型及其对应的参数，目前支持六种类型，IVFPQ，HNSW，GPU，IVFFLAT，BINARYIVF，FLAT（详细区别和参数可点此链接），目前我选择了较为基础的 IVFFLAT--基于量化的索引，后续如果数据量太大或者需要处理图数据时再优化。另外 Langchain 也有很方便的vearch存储和查询的方法可以使用。

实践效果

用例生成后是否真的能帮助我们节省用例设计的时间，是大家重点关注的，因此我随机在一个小型需求中进行了实验，此需求的 PRD 文档总字数 2000+，设计文档总字数 100+（因大部分是流程图），结果效率提升 50%。

优缺点

本次利用大模型自动生成用例的优缺点：

优势：