实验环境: Linux 、python3
毕业设计是关于软件缺陷定位的方法。该领域的常用数据集是西门子测试集。整体介绍如下:
- 该测试集共包含 7 个程序,每个程序对应一个正确版本和多个有 Bug 的版本(Bug 位置一般有注释,如果没有,手动用
diff
操作和正确版本比较差异可得。),并包含有若干项 TestCase。 - 这些程序都是用 C 语言写成,但因为该测试集时代久远,其很多 C 语言语法已经不符合现在的 GCC 编译规范,因此需要手动修改一些代码。
主要参考文章;西门子测试集简介
测试集目录结构
.
├── README.md
├── printtokens2_2.0.tar.gz
├── printtokens_2.0.tar.gz
├── replace_2.1.tar.gz
├── schedule2_2.0.tar.gz
├── schedule_2.0.tar.gz
├── tcas_2.0.tar.gz
└── totinfo_2.0.tar.gz
可以看到共有 7 个程序,用 replace
做例子,其余目录结构基本相同。
其中使用到的目录如下: