编译器缺陷辅助定位

最新推荐文章于 2021-06-23 15:56:18 发布

wxsAlice

最新推荐文章于 2021-06-23 15:56:18 发布

阅读量352

点赞数

文章标签：测试类型编译器

本文链接：https://blog.csdn.net/wxsAlice/article/details/115270572

版权

文章目录

编译器bug定位的难题
DiWi定位技术
技术描述

编译器bug定位的难题

基于测试数据生成的编译器缺陷辅助定位技术分为基于频谱的缺陷辅助定位(SBFL)，基于切片的缺陷辅助定位，基于变异的缺陷辅助定位，但无法用于编译器缺陷辅助定位。面对编译器缺陷辅助定位有三个挑战：编译器庞大致使在编译器上执行动态和静态分析非常耗时；编译器复杂则通过测试的测试代码和失败的测试代码的执行路径往往差别非常显著。

DiWi定位技术

作者提出编译器缺陷辅助定位技术DiWi，通过测试数据的生成来驱动编译器缺陷辅助定位。主要贡献是寻找证人测试代码（从可疑文件集合中消除无辜文件嫌疑的通过测试代码），基于它和给定的失败的测试代码，开发人员根据执行路径差异可以有效识别缺陷文件。

技术描述

在DiWi中，首先生成一组有效证人测试代码，将其与给定的失败测试代码进行覆盖信息的比较来辅助定义缺陷。
定义准则：
一：每一个证人测试代码应该与给定的失败测试代码有相似的编译器执行路径。
二：这一组证人测试代码应该在编译器的执行路径上具有足够多样性。

证人化变异

证人化变异为了满足第一个准则。证人化变异包括变量变异、操作变异和常量变异。变量变异指的是每一个代码变量都可以被改变成另一个兼容的变量或者类型；操作变异指的是每一个代码操作符都可以被变成其他可兼容的操作符；常量变异指的是每一个代码常量都可以被变成其他常量值。证人化变异如图1所示，其中变量(记洞_{v)、操作(记为洞}o)和常量(记为洞~c)，非终结符a、b和S代表算数表达式、布尔表达式和代码语句。终结符opa、opl、opr和opu表示了算数操作符、逻辑操作符、关系操作符和一元操作符。终结符x和n表示代码变量与常量。虽然这里使用WHILE风格语言来进行介绍，但是该技术可以应用到其他语言上，如C。

启发式证人测试代码生成

由于巨大的搜索空间和有限的计算资源，通过变异产生所有的证人测试代码，然后再从中选择一小组有效的证人测试代码是不可取的。基于该启示，DiWi提出一种启发式测试代码生成策略。在这里，DiWi使用覆盖距离来度量测试代码之间的多样性。距离公式如图3所示。

基于聚合机制的编译器可疑文件排序

在生成了一组证人测试代码之后，DiWi通过分析这组证人测试代码和给定的失败测试代码来辅助定位编译器缺陷。通过借鉴基于频谱的缺陷定位思想，DiWi为每一个在可疑文件中的语句计算可疑度值。在这里，DiWi采用一种最广泛使用的SBFL公式Ochiai来计算每一个可疑语句的可疑度值。该计算如图所示。

其中，e fs和n fs代表执行和没有执行语句s的失败的测试代码的数量，eps代表执行语句s的通过测试的测试代码的数量。在本章问题中，这里只有一个给定的失败测试代码并且仅仅考虑被失败测试代码覆盖的语句，因此，e fs为1和n fs为0。然后计算一个文件的可疑度值。
说明：该文章读取陈俊洁博士论文-数据驱动的编译器测试与调试若干技术研究编写。