论文分享 | Fuzz4All: 基于大语言模型的通用模糊测试

敲代码的猴先生

已于 2024-08-13 11:31:24 修改

阅读量1.6k

点赞数 23

分类专栏：模糊测试文章标签：模块测试人工智能语言模型笔记

于 2024-08-13 11:23:19 首次发布

本文链接：https://blog.csdn.net/u014250402/article/details/141159340

版权

大语言模型是当前最受关注的研究热点，基于其生成和理解能力，对现有领域在提升性能和效果上做更多尝试。分享一篇发表于2024年ICSE会议的论文Fuzz4All，它组合多个大语言模型以非常轻量且黑盒的方式，实现了一种跨语言和软件的通用模糊测试。

论文摘要

模拟测试在发现各种软件系统中的错误和漏洞方面取得了巨大成功，尤其是针对以编程语言或形式语言作为输入的被测系统（System Under Test，SUTs），例如编译器、运行时引擎、约束求解器和动态链接库等。现有的多种模糊测试工具通常只运行在特定语言上，无法直接应用于其他语言甚至同一语言的其他版本，且在进行模糊测试时也仅能发现特定功能的错误。

本文介绍了一种名为 Fuzz4All 的模糊测试工具，可以针对不同的语言及其特性进行通用的模糊测试。Fuzz4All 的核心思想是利用大语言模型作为输入生成和变异的引擎，使得其能够为任何相关语言提供多样化且真实的输入。为实现这一目标，论文提出了一种自动提示词技术，以及大语言模型驱动的模糊测试循环，可以迭代地更新提示词以创建新的输入。

作者在9个系统上测试了 Fuzz4All，其中包括了6种不同的语言（C、C++、Go、SMT2、Java 和 Python）作为输入，实验结果表明论文提出的通用模糊测试工具，相比于特定语言的模糊测试工具，具有更高的覆盖率。在广泛使用的系统中发现了98个错误，例如 GCC、Clang、Z3、CVC5、OpenJDK 和 Qiskit 量子计算平台，其中64个为以前未知的错误。