关于解决深度监测和跟踪器训练时hard postive样本不足的问题，三篇CVPR文章有感

最新推荐文章于 2024-05-23 19:22:58 发布

Trasper1

最新推荐文章于 2024-05-23 19:22:58 发布

阅读量595

点赞数

分类专栏： Deep Learning 目标检测 GAN Adversarial visual trakcing 文章标签： hard positive sample hard mining detection tracking GAN

本文链接：https://blog.csdn.net/Trasper1/article/details/81534309

版权

本文探讨了深度检测跟踪器在处理occlusion和deformation时hard positive样本不足的问题，指出传统的大规模数据集收集和hard mining方法的局限性。文章提出通过Adversarial学习，如A-Fast-RCNN、SINT++和VITAL，实现在特征映射上生成hard positive样本，以提高网络对罕见样本的鲁棒性。

摘要由CSDN通过智能技术生成

还是那个老故事，即如何解决Deep检测跟踪器训练时正样本（尤其在occlusion和deformation情况下的hard positive）不足的问题。这个问题的紧迫性在于这样样本的缺失导致训练所得网络在occlusion、deformation等appearance variation情况下的鲁棒性不足。

传统解决此问题有两个方向的思路：1. 尽可能收集和建立越来越大越来越全的数据库，期待这个数据库能够把方方面面的variation都囊括（比如COCO超过10K的汽车样本with variations）。可是，occlusion和deformation具有long-tail的特性，即便再大的dataset也很难得到一个足够全的数据库；2. Hard samples mining in Loss function，比如类似focal loss，这样做仅仅是增加了在训练时hard样本的单体对loss的贡献，但是依然不能解决有些很罕见样本根本收集不到的问题。

在解决此问题上，本文与SINT++的思路完全一样，即通过Adversarial的概念去直接学习从hard positive的long-tail distribution中学习采样生成现实中不存在的hard positive样本，学会如何去遮挡一些真的easy positive。注意，这里的生成依旧不是输入一张图，输出一张图的传统GAN模式。因为这样的传统GAN模式依旧摆脱不了对样本的需求。这里做的是在CNN的feature map上进行遮挡，而不是pixel-wise的逐像素生成，这样一来就对adversary训练的样本需求