retinanet 部署_RetinaNet (二) - 网络架构

最新推荐文章于 2024-08-11 09:35:58 发布

原思

最新推荐文章于 2024-08-11 09:35:58 发布

阅读量567

点赞数

文章标签： retinanet 部署

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31943449/article/details/113538911

版权

本文详细介绍了RetinaNet的网络架构，重点解析了FPN的工作原理，包括其代码实现，并探讨了分类和回归子网络的设计。通过结合ResNet和FPN，RetinaNet能有效地进行目标检测。此外，文章还提到了网络的后续预测融合策略，鼓励读者深入研究。

摘要由CSDN通过智能技术生成

Focal Loss for Dense Object Detection

上篇文章简单介绍了Focal loss，该方法现已被广泛应用。除此之外，个人觉得原文中提到的RetinaNet值得关注，看了代码后着重对FPN和分类/回归子网络的细节进行整理。Figure 1

RetinaNet的网络架构如上图所示，可以简单看作是ResNet+FPN+分类/回归子网络。关于ResNet，网上的资料很多，不再赘述。

一、FPN

有关FPN，可以参考我的文章进行理解：冲鸭嘎嘎：CVPR 2017 - FPN理解 - 简单高效的特征金字塔zhuanlan.zhihu.com

FPN对应的代码块如下:

class PyramidFeatures(nn.Module):

def __init__(self, C3_size, C4_size, C5_size, feature_size=256):

super(PyramidFeatures, self).__init__()

# upsample C5 to get P5 from the FPN paper

self.P5_1 = nn.Conv2d(C5_size, feature_size, kernel_size=1, stride=1, padding=0)

self.P5_upsampled = nn.Upsample(scale_factor=2, mode='nearest')

self.P5_2 = nn.Conv2d(feature_size, feature_size, kernel_size=3, stride=1, padding=1)

# add P5 elementwise to C4

self.P4_1 = nn.Conv2d(C4_size, feature_size, kernel_size=1, stride=1, padding=0)

self.P4_upsampled = nn.Upsample(scale_factor=2, mode='nearest')

self.P4_2 = nn.Conv2d(feature_size, feature_size, kernel_size=3, stride=1, padding=1)

# ad

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。