目标检测之RFB Net

重点是RFB模块!其他基本与SSD一致。

可以在兼顾速度的同时达到良好的效果。该网络主要在SSD网络中引入Receptive Field Block (RFB) ,引入RFB的出发点通过模拟人类视觉的感受野加强网络的特征提取能力,在结构上RFB借鉴了Inception的思想,主要是在Inception的基础上加入了dilated卷积层(dilated convolution),也叫空洞卷积层,从而有效增大了感受野(receptive field)。整体上因为是基于SSD网络进行改进,所以检测速度还是比较快,同时精度也有一定的保证。

RFB的效果示意图如Figure2所示,其中中间虚线框部分就是RFB结构。RFB结构主要有两个特点:1、不同尺寸卷积核的卷积层构成的多分枝结构,这部分可以参考Inception结构。在Figure2的RFB结构中也用不同大小的圆形表示不同尺寸卷积核的卷积层。2、引入了dilated卷积层,dilated卷积层之前应用在分割算法Deeplab中,主要作用也是增加感受野,和deformable卷积有异曲同工之处。在Figure2的RFB结构中用不同rate表示dilated卷积层的参数。在RFB结构中最后会将不同尺寸和rate的卷积层输出进行concat,达到融合不同特征的目的。在Figure2的RFB结构中用3种不同大小和颜色的输出叠加来展示。在Figure2的最后一列中将融合后的特征与人类视觉感受野做对比,从图可以看出是非常接近的,这也是这篇文章的出发点,换句话说就是模拟人类视觉的感受野进行RFB结构的设计。

在这里插入图片描述
Figure4是两种RFB结构示意图。(a)是RFB,整体结构上借鉴了Inception的思想,主要不同点在于引入3个dilated卷积层(比如33conv, rate=1),这也是这篇文章增大感受野的主要方式之一。(b)是RFB-s。RFB-s和RFB相比主要有两个改进,一方面用33卷积层代替55卷积层,另一方面用13和31卷积层代替33卷积层,主要目的应该是为了减少计算量,类似Inception后期版本对Inception结构的改进。

在这里插入图片描述
Figure5是RFB-Net300的整体结构示意图,基本上和SSD类似,和SSD不同的是:1、主干网上用两个RFB结构替换原来新增的两层。2、conv4_3和conv7_fc在接预测层之前分别接RFB-s和RFB结构,这两个结构的示意图如前面Figure4所示。
在这里插入图片描述
dilated卷积层优缺点:

  • 优点:
    解决了SSD对小物体检测不准确的缺点
    增加感受野
    不会增加参数量
    可以替代一个pooling池化层
  • 缺点:
    卷积核退化问题:像素利用率低,尤其在语义分割中利用率更低(语义分割rate为【2,24】,2的时候像素利用率只有9/25)

引入了DPN模型(在语义分割领域如何正确使用空洞卷积问题)

实验结果:
Table1是在PASCAL VOC2007 test-set数据集上的测试结果,训练集基于2007和2012的trainval。RFB Net300在mAP和FPS方面效果都不错。
在这里插入图片描述
Table4是在COCO test-dev 2015数据集上的测试结果。最后一个RFB Net512-E主要做了2点改变:1、对conv7_fc的输出特征做了上up-sample,然后和conv4_3的输出特征做融合,基于融合后的特征做预测。这种做法其实是借鉴了FPN算法的思想。2、在RFB结构中增加了7*7大小的卷积分支。这两点改进对效果的提升有一定帮助,而且带来的计算量也少。
在这里插入图片描述

Figure6是关于几个算法在COCO test-dev数据集上关于效果和速度的直观对比。
在这里插入图片描述

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
rfb-face-mask.pth 是一个文件路径,其中“rfb-face-mask”代表文件的名称,“.pth”代表文件的后缀。 这个文件很可能是一个神经网络模型的权重文件,用于实现人脸口罩检测。“rfb”可能是一种特定的神经网络架构,它通常用于目标检测任务。 人脸口罩检测是一种应用于人脸识别技术的衍生任务。由于全球的公共卫生危机,人们普遍开始佩戴口罩。因此,开发一种能够准确识别佩戴口罩的人脸识别系统变得尤为重要。 这个文件可能是通过使用大量带有和不带有口罩的人脸图像进行训练而生成的。训练神经网络需要大量的计算资源和时间,以使其能够从输入图像中准确地检测出人脸以及是否佩戴口罩。这样的模型可以应用于实时人脸识别系统中,以检测佩戴者是否佩戴口罩。 在应用人脸口罩检测系统时,我们可以使用这个.pth文件加载训练好的模型权重,将其应用于实时图像或视频上。该模型能够迅速地检测图像中的人脸,并识别它们是否佩戴口罩。这样的模型可以应用于公共场所、交通枢纽和其他需要识别佩戴口罩情况的区域。 总之,rfb-face-mask.pth 文件很可能是一个神经网络模型的权重文件,用于实现人脸口罩检测任务。它可以帮助我们识别图像中的人脸,并准确判断他们是否佩戴口罩,从而提高公共卫生安全的水平。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值