面向深度学习系统的模糊测试技术研究进展（2021）_基于深度学习的模糊测试有哪些故障-CSDN博客

本文链接：https://blog.csdn.net/peer_hellojio/article/details/133323734

本文总结了深度学习系统模糊测试的各个方面，包括测试用例生成、结果判定和覆盖分析，介绍了常用数据集和度量指标，并探讨了与符号执行、蜕变测试和基于梯度测试的比较，以及测试充分性的准则。未来研究方向聚焦于改进模糊测试以提高深度学习系统的鲁棒性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

摘要：

由于数据集的限制以及依赖人工标签数据, 深度学习系统易于出现非预期的行为。由于模糊测试具有较强的故障揭示能力, 运用模糊测试技术对深度学习系统进行测试成为研究热点。从测试用例生成 (包括种子队列构建、种子选择和种子变异)、测试结果判定、覆盖分析 3个方面对已有的深度学习系统的模糊测试技术进行总结, 并介绍常用的数据集以及度量指标, 最后对其发展方向进行展望。

介绍：

符号执行：困难(1) 深度学习模型通常没有分支; (2) 深度学习系统的非线性程度普遍较高, 难以找到合适的约束求解器; (3) 深度学习系统的结构复杂, 超出了目前符号推理工具的能力范围. 应对这些挑战的一个可行方案是将深度学习模型转化为程序。

蜕变测试：蜕变测试利用多个输入与输出之间的关系 (蜕变关系) 判定测试结果, 缓解了测试预言问题。

基于梯度的测试方法：深度学习系统本质是一个复杂的数学模型, 与其相关的函数 (例如损失函数、神经元的激活函数) 的梯度易于获取。

模糊测试：模糊测试在传统软件测试中表现出较强的故障揭示能力，与符号执行相比, 模糊测试不需要将深度学习系统转化为程序, 节省了测试资源. 尽管基于梯度的测试方法能够有效地揭示深度学习模型存在的故障, 现有研究结果表明模糊测试能够检测到基于梯度的测试方法无法检测的故障，与蜕变测试相比, 模糊测试的主要优势是能够在有限的测试用例中产生大量的测试用例, 劣势是不具备测试结果判定机制.

Zhang 等人[13]较为全面地调研了机器学习系统的测试技术, 包括机器学习系统属性 (正确性、鲁棒性和公平性等) 的测试方法、机器学习组件 (数据、学习程序和框架) 的测试方法、机器学习系统测试流程相关的研究 (测试用例生成、测试结果判定、测试充分性评估等) 和不同领域的机器学习系统的测试方法 (自动驾驶、机器翻译和自然语言处理)。

本文, 首先使用系统文献调研方法收集当前面向深度学习系统的模糊测试相关的研究论文; 分别围绕测试用例生成 (包括种子队列构建、种子选择和种子变异)、测试结果判定和覆盖分析 3 个方面, 总结已有的测试技术和结论并介绍常用的数据集以及度量指标;

测试充分性准则：与泛化能力的关系

深度学习系统改进的模糊测试：