缺陷定位-------论文阅读：采用基于多样性的过采样方法来缓解软件缺陷预测中的类不平衡问题

最新推荐文章于 2024-04-23 08:30:00 发布

qq_43771887

最新推荐文章于 2024-04-23 08:30:00 发布

阅读量435

点赞数

分类专栏：缺陷定位文章标签：机器学习人工智能 python

本文链接：https://blog.csdn.net/qq_43771887/article/details/121148671

版权

针对软件缺陷预测中的类不平衡问题，文章提出了一种名为MAHAKIL的新方法。该方法通过基于遗传理论和Mahalanobis距离的多样性过采样，生成多样化的合成少数类样本，以降低错误率并提高模型性能。这种方法避免了传统过采样方法可能导致的过度泛化，提高了召回率和精确度。

摘要由CSDN通过智能技术生成

MAHAKIL: Diversity Based Oversampling Approach to Alleviate the Class Imbalance Issue in Software Defect Prediction

前言

在做缺陷预测或者是其它分类任务的同时，高度不匹配的数据通常会使任务变得困难，往往采用合成过采样方法通过创建新的少数缺陷模块来平衡类分布来解决这一问题。尽管这些方法取得了成功，但它们大多导致过度泛化。

一、基本信息？

Ebo Bennin, K, Keung, J, Phannachitta, P, Monden, A, & Mensah, S. (2018). Mahakil: diversity based oversampling approach to alleviate the class imbalance issue in software defect prediction. IEEE Transactions on Software Engineering, 1-1.

二、文章内容

1.主要问题

The main problem is that common prediction algorithms assume that the
classes in any dataset are equally balanced. Thus, models trained o

最低0.47元/天解锁文章