BBC Net
BBC Net: Bounding-Box Critic Network for Occlusion-Robust Object Detection
BBC Net:遮挡鲁棒目标检测的边界盒临界网络
遮挡问题是降低检测质量的常见障碍。本文提出了一种新的目标检测框架,旨在解决遮挡情况下的鲁棒目标检测问题。
I. INTRODUCTION
所提出的基于深度学习的网络主要包括两个部分:
1)对象检测框架,其对对象类别进行分类并对对象位置进行定位
2)插入式边界框(BB)估计器,其根据骨干网络和对应的评论网络的特征图来估计对象和遮挡区域,以用于评估预测的BB图。
边界框(BB)估计器和评论网络是添加到对象检测框架中的插件模块,并且以对抗方式竞争学习。
BB-Critic网络的作用概念图:
现有的目标检测网络经常遗漏被遮挡的目标。通过在目标检测网络中加入遮挡感知的BB-Critic网络,并在训练阶段以插件方式进行学习,使目标检测网络能够灵活地对遮挡做出响应。红色和白色边界框分别表示检测到的结果和遗漏的结果。
II. RELATED WORK
B. Adversarial Learning in the Object Detection
III. PROPOSED METHOD
如图2所示,该方法由两个模块组成。第一模块是对象检测框架。它将对象的各种表示编码到分层特征图上。第二个模块是BB-Critic网络。它基于对象检测框架内的特征编码网络的语义特征图来检测遮挡区域以及对象区域。
在图2所示的训练阶段中,BB-Critic网络作为插件附接到对象检测框架,使得框架有效地学习关于对象和遮挡的信息。在测试阶段,对象检测框架执行检测并且不造成计算开销。
B. Bounding-Box (BB)-Critic Network
图3示出了所提出的BB-Critic网络的架构。它由两个BB估计器和相应的评价网络组成。两个BB估计器是高层BB估计器和低层BB估计器,它们估计多尺度BB图。
类别内遮挡BB图(Intra-category occlusion BB map)表示相同对象类别重叠时生成的图。类别间遮挡BB图(Inter-category occlusion BB map)表示当其他对象类别重叠时生成的图。在处理结束时,高层BB图的分辨率成为输入图像的分辨率的1/8。
输入图像的边界框内的像素区域被分配给BB图的每个类别。具体地,将边界框重叠的像素分配给类别内遮挡BB图,并且分配给不同类别的类别间遮挡。在这个例子中,人和马的重叠区域被分配给类别间遮挡。
BB评价器的细节:
评论网络的细节:
V. CONCLUSIONS
本文提出了一种新的考虑遮挡区域的目标检测训练框架。在提出的方法中,我们设计了边界盒(BB)估计器,用于以BB图的形式预测目标区域和遮挡区域。BB估计器估计输入图像的对象和遮挡特性。我们建立了高层和低层BB估计器来估计BB图。从而诱导特征编码网络对物体的区别特征和遮挡特征进行编码。
此外,我们设计了一个对应于BB估计器的评论网络,以改进BB估计器的预测。建议的评论网络将预测的BB图估计为地面实况或预测。利用该网络,BB估计器有效地估计出目标区域和遮挡区域.
还有,它将这些信息更有力地传递给特征编码网络,以提高性能。因此,我们结合了两种类型的网络(BB-Critic网络),并插入到通用对象检测框架中,以便在训练阶段学习遮挡。在测试阶段,不包括BB-Critic网络。
结果,通过BB-Critic网络考虑对象区域和遮挡区域的对象检测框架比未考虑的对象检测框架更灵活地检测对象。