信息检索报告_面向众包测试的高效测试报告分类方法

该研究提出了一种针对众包测试报告的高效分类方法,通过聚类克服工业数据的局部偏差,提高分类准确性和召回率。在35个工业项目15095份报告上,平均准确率为0.89,召回率为0.97,相比基线提升显著。
摘要由CSDN通过智能技术生成
c4d7518df9c4a230e563d2d6f5e11e14.png

J. Wang, Q. Cui, Q. Wang, and S. Wang, “Towards effectively test report classification to assist crowdsourced testing,” in Proceedings of ACM/IEEE International Symposium on Empirical Software Engineering and Measurement (ESEM 2016), 2016.

论文地址:https://ece.uwaterloo.ca/~s446wang/paper/esem-16.pdf

论文摘要

众包测试报告的自动分类很重要,因为它们数据量大和干扰信息多。目前该问题的大多数方法是应用不同机器学习或信息检索技术,并且大部分是在开源数据集上进行性能评估。但是根据我们的观察表明,这些方法在实际工业众包测试数据上产生了不良和不稳定的表现。我们进一步分析了深层原因,发现工业数据具有显着的局部偏差,这会降低现有方法的效果。

我们的目标是设计一种有效的方法来克服实际工业数据中的局部偏差,并自动从大量众包报告中对真实Bug进行分类。

我们提出了一种基于聚类的分类方法,首先将类似的报告聚集在一起,然后构建基于大多数相似聚类的分类器。

对中国最大的众包测试平台的35个工业项目的15095份测试报告进行了评估,平均0.89准确率和0.97找回率。此外,我们的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值