如何利用大模型开展软件测试

Python编程杰哥

于 2024-08-08 20:48:54 发布

阅读量422

点赞数 4

文章标签： langchain ide 人工智能 llama 语言模型

本文链接：https://blog.csdn.net/xx_nm98/article/details/141036054

版权

利用大模型开展软件测试

一、自动化测试用例生成

软件的需求规格说明书和设计文档通常包含了对软件功能和行为的详细描述。大模型可以对这些文本进行深入理解和分析，提取关键信息，例如输入条件、预期输出、边界值等。然后，基于这些信息，模型能够按照一定的规则和逻辑生成初步的测试用例。这些测试用例可以涵盖常见的功能场景和基本的异常情况，为测试人员提供一个良好的起点。但需要注意的是，生成的测试用例可能需要人工进一步的审查和优化，以确保其准确性和有效性。

二、缺陷预测

软件的开发过程中会积累大量的缺陷数据，包括缺陷的类型、出现的位置、引发的条件等。大模型可以对这些历史数据进行学习，发现其中的模式和规律。同时，结合对当前软件代码的静态分析和动态监测，模型能够识别出代码结构中的潜在风险点和与以往缺陷相似的特征。例如，如果某类函数在过去经常出现内存泄漏的问题，而当前软件中存在类似的函数结构，大模型就可以预测该部分可能存在缺陷，从而引导测试人员提前进行重点测试。

三、测试结果分析

在软件测试过程中会产生海量的测试结果数据，包括测试通过与否、测试执行的时间、测试过程中产生的日志等。大模型能够对这些复杂的数据进行整合和分析。通过数据挖掘和机器学习算法，模型可以发现隐藏在数据中的模式和趋势。例如，它可能会发现某些特定的操作序列总是导致软件崩溃，或者某些模块在特定的时间段内错误率明显上升。这些发现可以帮助测试人员更好地理解软件的行为，更快地定位和解决问题。

四、优化测试策略

大模型可以根据对软件的整体理解，包括功能的重要性、复杂度、变更频率等因素，为测试人员提供关于测试优先级的建议。对于关键的、复杂的或者经常变动的功能，模型可以建议分配更多的测试资源和时间。同时，模型还可以评估当前的测试覆盖度，指出哪些部分的代码或功能尚未得到充分测试，以便测试人员能够及时调整测试计划，确保软件的各个部分都能得到足够的关注。

五、智能测试执行

在自动化测试执行过程中，大模型可以实时监测测试的进展和结果。如果某个测试步骤连续多次失败，模型可以分析失败的原因，并尝试调整后续的测试步骤或参数。例如，如果某个性能测试发现响应时间超出预期，模型可以自动调整并发用户数或数据量，以进一步探索软件的性能极限。此外，模型还可以根据实时的资源使用情况，合理分配测试任务，提高测试执行的效率。

六、兼容性测试辅助

如今的软件需要在各种各样的操作系统、浏览器版本、硬件设备上正常运行。大模型可以根据以往的兼容性测试数据和对不同平台特性的了解，预测在新的软件版本中可能出现兼容性问题的组合。例如，某个新的功能可能在特定版本的 Android 系统上与某些硬件不兼容，模型可以提前提醒测试人员进行针对性的测试，减少兼容性问题带来的风险。

总之，虽然大模型在软件测试中具有巨大的潜力，但它并不能完全取代人工测试。测试人员的经验、判断力和对业务的深入理解仍然是不可或缺的。大模型应该被视为一种辅助工具，与人工测试相结合，共同提高软件测试的质量和效率。

大模型工具：

1. OpenAI GPT-3 或 GPT-4：具有强大的语言理解和生成能力，可以用于生成测试用例描述、分析测试结果报告等。
2. 谷歌云的语言模型：如 Vertex AI，能够协助进行自然语言处理相关的测试任务。
3. 百度的文心一言：可以在软件测试的文档分析、需求理解等方面提供支持。

案例

案例一：

某大型软件公司正在开发一款复杂的企业管理软件。测试团队利用 GPT-4 来协助生成测试用例。他们向 GPT-4 提供了软件的功能描述、需求文档和技术架构等信息。GPT-4 根据这些输入生成了一系列详细且全面的测试用例，包括正常流程、异常情况和边界值测试等。测试人员在此基础上进行了补充和优化，大大提高了测试用例的覆盖度和质量。

案例二：

一家互联网公司开发了一款新的社交媒体应用。在测试用户界面和交互体验时，测试人员向 GPT-4 描述了应用的设计理念和目标用户群体。GPT-4 基于这些信息，提供了一些关于用户可能的操作路径和可能出现的体验问题的建议。测试人员根据这些建议进行了针对性的测试，发现并解决了一些在早期设计中未被考虑到的用户体验缺陷。

案例三：

在对一款金融交易软件的性能测试中，测试团队使用 GPT-4 来分析大量的性能测试数据。GPT-4 能够快速识别出数据中的异常模式和潜在的性能瓶颈，并提供了可能的原因和优化建议。这帮助开发团队迅速定位并解决了一些关键的性能问题，确保软件在高并发交易场景下的稳定性和响应速度。

案例四：

一家游戏开发公司在测试一款新游戏时，利用 GPT-4 来生成游戏剧情和任务的测试场景。GPT-4 根据游戏的背景故事和设定，创造了各种富有挑战性和多样性的测试场景，包括不同的剧情分支和玩家决策选项。这使得测试人员能够更全面地测试游戏的剧情逻辑和可玩性，提升了游戏的质量。

案例五：

对于一个移动应用的兼容性测试，测试团队向 GPT-4 提供了应用的功能特点和目标设备列表。GPT-4 根据这些信息，预测了在某些特定设备和操作系统组合上可能出现的兼容性问题。测试人员据此进行了重点测试，提前发现并解决了一些在特定设备上的显示异常和功能失效问题。

GPT-4 测试用例生成操作流程

以下是一份更详细的利用 GPT-4 生成测试用例的操作流程：
一、准备阶段
1. 明确测试目标和范围
• 确定要测试的软件模块、功能或系统的整体范围。
• 明确测试的主要目标，例如验证功能的正确性、性能表现、安全性等。
2. 收集相关资料
• 获取软件的需求文档、设计文档、用户手册、技术规格说明等。
• 整理以往的测试报告、缺陷记录，了解可能存在的问题区域。
3. 制定测试策略
• 确定采用的测试类型，如功能测试、性能测试、兼容性测试等。
• 规划测试的优先级和重点。
二、与 GPT-4 交互阶段
1. 选择合适的接口或平台
• 可以通过官方提供的接口，或者使用整合了 GPT-4 的相关测试工具或在线平台。
2. 输入详细的软件信息
• 向 GPT-4 清晰地描述软件的功能、操作流程、输入输出要求等。
• 举例说明各种正常和异常的使用场景。
3. 提出明确的测试用例生成要求
• 例如：“请为这个在线购物车功能生成功能测试用例，包括添加商品、修改数量、删除商品等操作，以及考虑商品库存不足、网络延迟等异常情况。”
三、生成与评估阶段
1. 获取 GPT-4 生成的测试用例
• 仔细阅读和理解 GPT-4 输出的测试用例内容。
2. 初步评估测试用例
• 检查用例的完整性，是否涵盖了主要的功能和异常情况。
• 审查用例的可执行性，是否有清晰的步骤和预期结果。
3. 对比和参考
• 将 GPT-4 生成的用例与自己预先设想的用例进行对比，取长补短。
四、优化与完善阶段
1. 反馈与改进
• 如果发现生成的用例存在不足或不准确的地方，向 GPT-4 提供反馈，要求进一步优化或补充。
• 例如：“这个测试用例中没有考虑到多用户同时操作购物车的情况，请补充相关内容。”
2. 人工调整和补充
• 根据实际的测试需求和经验，对 GPT-4 生成的用例进行人工修改和补充。
• 增加特定的边界值测试、压力测试用例等。3. 用例审查
• 组织测试团队对最终的测试用例进行内部审查，确保其质量和有效性。
4. 记录和整理
• 将优化后的测试用例整理成规范的文档，记录每个用例的编号、描述、步骤、预期结果等。
五、后续跟踪与更新阶段
1. 测试执行
• 按照生成的测试用例进行实际测试，并记录测试结果。
2. 问题反馈
• 如果在测试过程中发现新的问题或未被覆盖的情况，及时反馈给 GPT-4 以改进后续的用例生成。
3. 定期更新
• 随着软件的迭代和变更，重新利用 GPT-4 生成新的测试用例或对现有用例进行更新。
通过以上详细的操作流程，可以更有效地利用 GPT-4 来生成高质量的测试用例，提高软件测试的效率和效果。

以下是一个在电商网站的“商品下单与支付”功能的实际业务场景中，利用 GPT-4 生成测试用例的实例：

准备阶段：
测试目标：确保商品下单与支付流程的正确性、稳定性和安全性。
收集的资料：电商网站的需求文档，详细描述了下单与支付的流程，包括用户选择商品、填写收货地址、选择支付方式、输入支付密码等步骤。
测试策略：先进行功能测试，覆盖正常流程和各种异常情况；然后进行性能测试，检查在高并发情况下的支付响应时间；最后进行安全测试，防止支付信息泄露。

与 GPT-4 交互阶段：
输入信息：“这是一个电商网站的商品下单与支付功能。用户可以选择商品加入购物车，然后进入购物车结算，填写收货地址，选择支付方式（如微信支付、支付宝支付、银行卡支付），输入支付密码完成支付。请为这个功能生成测试用例，包括正常流程和各种可能的异常情况。”

生成与评估阶段：
GPT-4 生成的测试用例可能如下：

正常流程：

1. 用户选择一件商品，加入购物车，进入购物车结算，填写正确的收货地址，选择微信支付，输入正确的支付密码，成功完成支付。验证支付结果显示为“支付成功”，订单状态更新为“已支付待发货”，用户收到支付成功的通知短信或邮件，支付结果显示准确的支付金额和支付时间，且在用户的订单列表中能正确显示该订单。

2. 用户选择多件不同商品，加入购物车，进入购物车结算，填写详细的收货地址（包括省市区、街道、门牌号等），选择支付宝支付，输入正确的支付密码，成功完成支付。验证支付结果显示准确的支付金额和支付时间，订单状态更新无误，且在用户的订单列表中能正确显示该订单，优惠金额正确扣除，支付结果显示实际支付金额。

3. 用户选择有优惠活动的商品，使用优惠券后进行结算，填写收货地址，选择银行卡支付，输入正确的支付密码，成功完成支付。验证优惠金额正确扣除，支付结果显示实际支付金额，订单状态及相关信息更新准确，用户收到支付成功的通知。

异常情况：

1. 用户在购物车结算时，填写收货地址不完整（缺少省份或城市），系统提示错误信息，无法进行支付。验证支付页面保持未支付状态，订单未生成。
2. 用户选择支付方式后，取消支付，再次选择另一种支付方式进行支付，流程正常。验证最终支付结果准确反映所选的支付方式，订单状态与实际支付情况相符。
3. 用户输入错误的支付密码，系统提示密码错误，连续输入错误三次，账户被锁定。验证支付未成功，订单状态为“未支付”，且用户收到账户锁定的通知。
4. 用户在支付过程中，网络中断，重新连接网络后，支付流程能够继续或自动取消。若支付成功，验证支付结果和订单状态更新正常；若支付取消，验证订单未生成。
5. 商品库存不足时，用户进行结算，系统提示库存不足，无法完成支付。验证支付未进行，订单未生成，用户收到库存不足的提示。

人工补充测试用例：

1. 用户在支付过程中，突然断电，重新开机后，查看支付状态。若支付成功，验证支付结果、订单状态和相关通知正常；若支付未完成，验证是否可以继续支付或订单自动取消。
2. 支付金额超过用户所选支付方式的限额，系统提示并引导用户更换支付方式。验证提示信息准确，更换支付方式后能成功支付，支付结果和订单状态更新无误。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

在这里插入图片描述

Python编程杰哥

关注

4
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
如何利用大模型开展软件测试

利用大模型开展软件测试一、自动化测试用例生成软件的需求规格说明书和设计文档通常包含了对软件功能和行为的详细描述。大模型可以对这些文本进行深入理解和分析，提取关键信息，例如输入条件、预期输出、边界值等。然后，基于这些信息，模型能够按照一定的规则和逻辑生成初步的测试用例。这些测试用例可以涵盖常见的功能场景和基本的异常情况，为测试人员提供一个良好的起点。但需要注意的是，生成的测试用例可能需要人工进一步的审查和优化，以确保其准确性和有效性。二、缺陷预测。
复制链接

扫一扫