对于软件缺陷预测技术的研究目前主要集中在对现有模型的不足进行改进上。改进主要集中在两方面,模型的实质是数学运算,包含很多可变的参数,模型对参数一般都很敏感,不合适的参数选择方法会导致预测效果的降低,如何合理地对各类模型的参数进行选择是目前面临的问题之一。另外一方面,数据集冗余等因素的存在,使得分类器不可避免地吸收了部分冗余,影响了预测精度。如何在数据进入分类器前尽可能去除数据的冗余因素影响也是不得不解决的问题之一。所以,目前的研究工作主要针对这两个问题,在两个不同的切入点对成熟或经典模型进行改进。
对基础分类模型参数选择的优化,希望能够找到最合适的参数使模型的效果达到最优。这是如今静态预测技术研究的切入点之一。除此之外,还有另一个得到广泛研究的切入点,即对缺陷数据的预处理方法的研究。这两个切入点是软件缺陷预测领域研究工作的热点,它们分别从模型的内部优化和模型的外部优化角度出发,目的都是提高预测的准确率。当然,目前的研究工作更多的是将两者结合,内部外部因素都予以考虑,希望能够将优化效果最大化。但同时考虑内部和外部因素会引起变化因素过多,无法有效进行变因控制,难以将两方面优化都做好,在研究过程中需要注意这点问题
软件缺陷预测综述:
Feature Selection with Imbalanced Data for Software Defect Prediction
Attribute Selection and Imbalanced Data:Problems in Software Defect Prediction
A Novel Feature Selection Technique for Highly Imbalanced Data
Dictionary Learning Based Software Defect Prediction
Software defect prediction using cost-sensitive neural network