小目标检测算法对比——AZ-NET VS PGAN

这两篇论文都是对小目标检测进行改进的算法,AZ-NET是一篇2016年的CVPR论文,而PGAN则是2017CVPR的一篇论文,二者之间采用了不同的方法,在本文中将对二者主要采用的方法进行介绍并对二者的检测效果进行对比。
原文地址:
AZ-NET 原文
PGAN 原文

AZ-NET

AZ-NET:一种基于fast rcnn改进的算法,去除掉了selective search的预选方法,采用了AZ-NET对于临近区域进行检测并给出一组相应的输出数据包括:是否进一步放大或分割区域,临近区域的预测边界框和置信率。对于一个包含小目标的区域,算法能够持续进行细化分割区域,以便实现最终的检测。小目标的检测在两步网络的主要问题是第一步的区域建议可能存在问题,对于第二步的检测错误率相对较低,因此第一步的建议框选至关重要。目前比较常用的两步检测算法是faster rcnn,该算法在第一步采用了RPN结构,在VGG16提取的feature map中采取固定大小的anchor对目标进行检测,然而这一步骤在计算中必然占用大量时间和内存资源,同样由于anchor的固定尺寸对于和anchor尺寸匹配不佳的目标将难以准确检测,因此对于目标大小的自适应区域建议检测是有必要的,尤其对于小目标的检测。从检测效果来看,AZ-NET始终略由于RPN,如图:
在这里插入图片描述
此外,对于小目标的检测还可以采用低阈值的AZ-NET进行第一次目标区域建议,并保留较多建议后再次输入至RPN1-2次(阈值将指逐步提升),再次情况下或可能提高小目标的检测效果。


--------------假装有分割线------------------
markdown语法使我快乐,减少鼠标操作
PGAN是一种基于生成对抗网络的目标检测算法,由于卷积神经网络的本质就是对目标特征的提取,因此小目标未能被有效识别的原因就是RPN无法有效识别小目标的特征或者说小目标和大目标之间的特征存在一定的偏差,基于此情况出现了PGAN算法。
该算法中采用GAN网络模拟大目标与小目标之间特征的差,训练至一定程度后,将网络训练的结果与直接提取的特征进行求和即可得到新的特征,在保证大目标特征基本不变的前提下提升了小目标的有效被识别,其对别结果如下图:

在这里插入图片描述


两种方法之间并不存在直接的对比,但仍能看出PGAN的效果要优于AZ-NET


检测算法的效果始终在飞速的提升,网络结构也在不断的改变,PGAN明显借鉴了GAN的网络内容和思想,也证明了在探索和尝试改进算法的过程中可以参考一些新的、其他方面的网络结构或者是方法

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值