对《HYDRA:Massively Compositional Model for Cross-Project Defect Prediction》的复现-GA phase

本文复现了《HYDRA》论文中GA阶段,利用遗传算法训练N+1个底层逻辑回归分类器。通过轮盘赌选择、单点交叉和随机变异操作优化权值和阈值。最后,讨论如何应用这些分类器进行软件缺陷预测。
摘要由CSDN通过智能技术生成

论文《HYDRA:Massively Compositional Model for Cross-Project Defect Prediction》(以下简称论文),发表于2016的TSE。其模型算法主要分为两个阶段(GA phase & EL phase),本篇主要讲GA phase的复现。

  • GA phase:对源数据集 S=[S1,S2,...,SN] S = [ S 1 , S 2 , . . . , S N ] 以及目标数据集T,训练 N N 个底层分类器(底层分类器均使用Logic Regression)。第 i 个底层分类器使用的训练集为 SiT^ S i ∪ T ^ ,其中 T^ T ^ 是从 T T 中抽取的部分(10%)带有标签的样本,剩余的90%作为测试集。对于 T 中90%的样本,同时作为第 N+1 N + 1 个底层分类器的训练集与测试集,训练得到第 N+1 N + 1 个底层分类器。此时共计得到 N+1 N + 1 个底层分类器,记为 clf_list=[clf1
  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值