TridentNet算法笔记

TridentNet算法通过多分枝、权重共享和指定尺度过滤训练提高目标检测性能,尤其是在处理尺度变化上。论文展示了不同感受野与检测效果的关联,并在ResNet基础上构建了包含3个具有不同dilation参数分支的结构,以适应不同尺度的目标。权重共享减少了计算时间和过拟合风险,而指定尺度过滤训练使每个分支专注于特定尺寸目标。实验结果显示,TridentNet在Faster RCNN和Deformable Faster RCNN上均有显著提升,确立了其在目标检测领域的领先地位。
摘要由CSDN通过智能技术生成

论文:Scale-Aware Trident Networks for Object Detection
论文链接:https://arxiv.org/abs/1901.01892
代码链接:https://github.com/TuSimple/simpledet/tree/master/models/tridentnet

目标检测中物体的尺度变化一直是关注的热点,毕竟要兼顾大尺寸目标和小尺寸目标有一定难度。早些年的图像金字塔(image pyramid),如Figure1(a)所示,通过缩放输入图像实现不同尺寸目标的检测,效果很不错,现在许多比赛中仍会采用多尺度测试提升模型效果,缺点就是速度太慢,实际项目中很难使用。之前的SNIP、SNIPER、AutoFocus等算法算是图像金字塔的优化版,目的是减少不必要的计算,提速比较明显,但离实际应用还有点差距。

特征金字塔是另外一种尝试,代表作就是FPN,如Figure1(b)所示,效果上不如图像金字塔,但是速度方面有优势。

图像金字塔和特征金字塔本质上都是希望不同尺度的目标有不同的感受野,这样提取到的特征才比较全面,因此TridentNet算法从感受野入手,通过引入空洞卷积增加网络的感受野,从而实现不同尺度目标的检测,如Figure1(c)所示,比较吸引我的地方在于算法整体上非常简洁,

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值