cascade中FPN base模型图理解

0.上图是普通的FPN

 

1.下面是我自己手绘的模型图,首先C2-C5 表示的res2c-res5c每个对应的末层进行1*1*256全卷积,保证通道的一致。

2.下图1中包含了从下往上(up branch)(不断向上 下采样)即把底层的细节带给顶层,这样P5这样的层寻找大目标的时候就会更准确,和从上往下(down branch)(不断向下 上采样),保证底层的语义信息增强,小目标的勘测能力变强。且下图给出了最方便的P2和P5层。

3.下图2给出了P3,P4的生成。

4.最终P层后面都接上RPN就是RPN

注意:cascade中已经把上采样改成了反卷积,也因此short size这些只能是32的倍数

 

------------------------------------------------------------------------------------------------

 

后来添加,整体理解的添加,和普通的FPN自底向上和自顶向下不一样。注:下文用到的C层都是经过全卷积的,通道都是256.

普通的P2层是C2+P3(上采样)=

C2+((C4经过3*3去混叠+C5经过3*3去混叠*上采样)*上采样+C3经过3*3去混叠*上采样后3*3卷积,去除混叠现象。

cascade base中的P2=C2+C3上采样+C4上采样上采样+C5上采样上采样上采样,然后3*3卷积,去除混叠现象。

------------------------------------------------------------------------------------------------

普通的P3层=C3+P4(上采样),然后3*3卷积,去除混叠现象。

cascade base中的P3=C5上采样上采样+C4上采样+C3+C2下采样然后3*3卷积,去除混叠现象。

------------------------------------------------------------------------------------------------

同理P4层=C4+P5(上采样)=C4+C5经过3*3去混叠*上采样,然后3*3卷积,去除混叠现象。

cascade base中的P4=C5上采样+C4+C3下采样+C2下采样下采样然后3*3卷积,去除混叠现象。

------------------------------------------------------------------------------------------------

普通P5=C5然后3*3卷积,去除混叠现象。而cascade base中的P5=C5+C4下采样+C3下采样下采样+C2下采样下采样下采样,然后3*3卷积,去除混叠现象。

------------------------------------------------------------------------------------------------

灵感:这么做就有一点点PANet的感觉了,但又不是PANet。

说他像,是因为他的自底向上的这种short cut是同一种思维。也就是多了底层相加的操作,不像原来就是一股脑往上传。

说他又不是,是因为PANet中相加的操作,用的是P层与P层的下采样相加得到N层,而这里却用到的是C层与C层的下采样还有C层的上采样相加

=======================================================

下图是PAnet的意绘图。

-------------------------------------------------------------------------------------------------

 

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Cascade R-CNN是一种用于目标检测的深度学习结构,通过级联多个R-CNN模块来提高检测的准确性和鲁棒性。 Cascade R-CNN结构由三个主要部分组成:基础网络、R-CNN模块和级联结构。 基础网络通常采用卷积神经网络(CNN),用于提取像的特征。常见的基础网络有ResNet、VGG等。基础网络负责将原始像输入,并逐层提取出高层次的特征,以供后续处理使用。 R-CNN模块是Cascade R-CNN的核心部分。它由若干个R-CNN模块级联而成,每个R-CNN模块通过一个CNN来进行特征提取,然后通过一个ROI Pooling层提取出感兴趣区域(Region of Interest)的特征。接着,这些特征经过全连接层,进行目标分类和边界框回归。 级联结构是Cascade R-CNN的独特之处。它通过级联多个R-CNN模块来逐步提高目标检测的准确性。级联结构的每个阶段都会选择性地引入难例样本,以便让模型更好地学习难以区分的目标。级联结构通常包括三个阶段,每个阶段从不同的阈值划分正负样本,通过进一步训练来提高检测的精度和召回率。 总结起来,Cascade R-CNN的结构展示了一个多阶段的目标检测系统。它通过级联多个R-CNN模块,逐步提高检测的准确性和鲁棒性。基础网络用于特征提取,R-CNN模块用于目标分类和边界框回归,级联结构用于引入难例样本并提高检测性能。这种结构在目标检测领域取得了显著的性能提升。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值