变异测试是一种 fault-based 的软件测试技术。这项技术已经广泛研究并使用了三十余年。它为软件测试贡献了一系列方法,工具,和可靠的结果。本文将对变异测试进行深入的调查,分析它的优势和不足之处,并对比几种不同的变异测试方法,提出一些改进的建议。
下面用一个例子来解释什么是变异测试,考虑以下代码片段:
if(a && b) c = 1;
else c = 0;
条件运算符如果用||来替换&&,就会产生以下变异:
if(a || b) c = 1;
else c = 0;
为了杀死这个突变,需要满足以下条件:
(1)测试数据必须对突变和原始程序引起的不同状态覆盖。如:a=1,b=0可以达到目的。
(2)c的值应该传播到程序输出,并被测试检查。
弱突变覆盖需满足(1),强突变覆盖需满足(1)(2)。
下面进行正式的内容。
1 变异测试理论
1.1 两个基本假设
变异测试旨在找出有效的测试用例,发现程序中真正的错误。在一个工程中,潜在BUG的数量是巨大的,通过生成突变体来全面覆盖所有的错误是不可能的。所以,传统的变异测试旨在寻找这些错误的子集,能尽量充分地近似描述这些BUG。这个理论基于两条假设:Competent Programmer Hypothesis(CPH) 和 Coupling Effect(CE)。
CPH是指:假设编程人员是有能力的,他们尽力去更好地开发程序,达到正确可行的结果,而不是搞破坏。它关注的是程序员的行为和意图。而CE(耦合效应)更加关注在变异测试中错误的类别。一个简单的错误产生往往是由于一个单一的变异(例如句法错误ÿ