论文:Scale-Aware Trident Networks for Object Detection
论文链接:https://arxiv.org/abs/1901.01892
代码链接:https://github.com/TuSimple/simpledet/tree/master/models/tridentnet
目标检测中物体的尺度变化一直是关注的热点,毕竟要兼顾大尺寸目标和小尺寸目标有一定难度。早些年的图像金字塔(image pyramid),如Figure1(a)所示,通过缩放输入图像实现不同尺寸目标的检测,效果很不错,现在许多比赛中仍会采用多尺度测试提升模型效果,缺点就是速度太慢,实际项目中很难使用。之前的SNIP、SNIPER、AutoFocus等算法算是图像金字塔的优化版,目的是减少不必要的计算,提速比较明显,但离实际应用还有点差距。
特征金字塔是另外一种尝试,代表作就是FPN,如Figure1(b)所示,效果上不如图像金字塔,但是速度方面有优势。
图像金字塔和特征金字塔本质上都是希望不同尺度的目标有不同的感受野,这样提取到的特征才比较全面,因此TridentNet算法从感受野入手,通过引入空洞卷积增加网络的感受野,从而实现不同尺度目标的检测,如Figure1(c)所示,比较吸引我的地方在于算法整体上非常简洁,