深度学习训练网络技巧篇: 调整dataloader函数来提升mAP

最新推荐文章于 2024-08-11 22:04:36 发布

Mr.Jk.Zhang

最新推荐文章于 2024-08-11 22:04:36 发布

阅读量1.1k

点赞数 1

分类专栏：目标检测深度学习计算机视觉

本文链接：https://blog.csdn.net/mrjkzhangma/article/details/100785099

版权

上海交大MVIG团队的InstaBoost方法通过调整dataloader提升COCO数据集上的实例分割mAP，包括Random InstaBoost和Map-guided InstaBoost，实现了显著性能提升。该方法已在Mask R-CNN和Cascade R-CNN等框架上验证，开源代码可供使用。

摘要由CSDN通过智能技术生成

前言: 换个dataloader函数，可能会有意想不到的收获。近期，上海交大MVIG团队提出InstaBoost，在COCO数据集上训练提升3mAP。目前，研究团队已将代码及训练好的模型全部开源，包括 Res50, Res101 base 的 Mask R-CNN, Cascade Mask R-CNN, SSD 等，未来还将有更多模型开源，如 yolact 等。

该方法的操作非常简单，目前已发布为 pip 包，只需 python 中加一行代码，import instaboost，换一个 dataloader 函数就可以在 COCO 实例分割数据集上实现显著的性能提升。

近年来，基于 CNN 的深度学习算法，如 Mask R-CNN 等，在实例分割任务中有了非常广泛的应用。但是出于像素级别的标注成本高，周期长，难度大等原因，这些深度学习框架的潜力因为缺少大量的训练数据而难以被充分挖掘出来。

此前，Google 研究团队曾研究利用 bounding box 标签，运用强化学习进行数据增强，并获得了一定提升。不过，在实例分割领域，如何利用 mask 标签在 COCO 数据集上获得提升，仍是一个需要探索的问题。

然而实例分割这种像素级的分类要比目标检测难很多，对应的数据增强也要困难很多，这主要体现在它并不能随意把目标切割并移到另外的背景上，因为它们对分割结果也有很大的影响。

来自上海交通大学 MVIG 实验室的研究人员在实例分割应用中对其进行改进优化，成功的将模型的实例分割精度大幅提升，同时也能实现目标检测的提升。