目标检测之CornerNet-Lite

论文: CornerNet-Lite: Efficient Keypoint Based Object Detection

Githubhttps://github.com/princeton-vl/CornerNet-Lite

 

CornerNet作为无anchor检测框架的典范,CornerNet-Lite依然是普林斯顿的几位哥们的续集。

论文主要改进CornerNet推理速度慢的问题,提出了CornerNet-LiteCornerNet-Lite主要由2个侧重不同的网络组成,分别是CornerNet-SaccadeCornerNet-SqueezeCornerNet-Saccade适用于离线检测,相比CornerNetCOCO数据集上提升了1%的准确性和6倍的速度。CornerNet-Squeeze适用于实时检测,相比YOLOv3coco数据集上提升1.4%。速度快5ms

 

主要贡献:

  1. 提出了CornerNet-SaccadeCornerNet-Squeeze两个新颖的结构作为无anchor领域的检测算法。
  2. CornerNet-Saccade相比CornerNetcoco数据集上将准确性从42.2%提升到43.2%,速度提升6倍。
  3. CornerNet-Squeeze相比CornerNetcoco数据集上将准确性从33.0%提升到34.4%,速度从39ms降低到30ms

 

目标检测中的视觉扫动(Saccades):

人类寻找物体是一个动态的过程,且寻找时间与场景的复杂度是直接相关的。当我们的眼神在不同的点之间漂移时,其他的区域会被我们有意忽视。

 

然而,现在的检测算法是一种静态的推理过程且图像金字塔中的每个像素都受到了一样的对待,这使得过程变得没有效率。像selectivesearch或者RPN等,每一个像素区域都得到了公平的对待。而基于人眼扫动,这种attention机制的思想,却可以减少好多无用的计算。直接提取到注意力关注区域。像AutoFocus算法,Autofocus: Efficient multi-scale inference,大大的提高了faster rcnn的训练速度。

 

CornerNet-Saccade

首先将输入图片通过resize下采样操作2次,分别得到2个图像,分别为长边255像素和长边192像素。然后类似faster rcnn一样,将192长边的图像上下左右补黑色像素至255大小,这样这2个图就可以走batch。当然和faster rcnn还有一点区别,faster中是直接从左上角开始对齐,不足的地方补充黑色像素。

然后基于一个沙漏模块的编码解码模块,在解码模块的不同层上可以分别得到3个不同大小的特征图,分别预测小物体(少于32像素),中物体(3296像素),大物体(大于96像素),每一个层分别接入3*3conv+RELU+1*1conv+Sigmoid,最终得到3个预测的attention特征图。而在测试的时候只处理阈值大于0.3的特征图区域。

基于这3个特征图,可以得到在这3个特征图上的物体坐标和缩放尺度,基于此,还原回原图的坐标。而训练的时候是在每一个物体的中心位置点作为attention点,并使用focal loss进行训练。

然后基于得到的尚不精确的边框,根据边框得分进行排序,取前top-k的边框。

最后基于这些边框从原图crop出这些区域,再经过2个沙漏结构的网络,得到最终的预测的精确的边框坐标。最后进行soft-nms操作,得到最终的结果。

 

CornerNet的解构对比,

CornerNet2个沙漏,104

CornerNet-Saccade3个沙漏,54

 

CornerNet-Squeeze

该网络的改进思想源自SqueezeNetMobileNets

  1. 使用SqueezeNet中的firemodule替换CornerNet中的残差模块。包括squeeze layer中的1*1卷积替代3*3卷积进行通道的降维。expand layer3*3+1*1卷积替代3*3卷积。
  2. 使用3*3depthwise conv替换firemodule中的传统3*3 conv

实验结果:

 

总结:

作为CornerNet的后续之作,贡献了2个轻量级的无anchor检测框架。

  • 5
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值