yolov4里面的特征融合不是用add而是concat

resnet,fpn这些网络结构,特征融合用的是add操作,而在一些目标检测网络和语义分割网络中,特征的融合往往是用concat,为什么不用add呢?

查了一些资料,我的理解是,add用于特征信息的叠加,通道数不变,这对于单张图片分类是有好处的,比如一张13*13的小图有眼睛的特征,26*26的特征图有脸的信息,你一add,就能更好的说明这个是人脸。也就是说add是基于你默认对应通道的特征图语义类似(非常关键),从而对应的特征图可以共享一个卷积核。

但是在目标检测和语义分割网络中,一张图百分之九十九是有多个目标的,需要分类出来,那么直接语义叠加显然不合适。比如如果一张小特征图有猫的眼睛,一张大特征图有狗的尾巴,你直接叠加,是不是反而不利于分类了?所以,因为这个时候不能认为对应通道的特征图语义类似,所以接下来不能共享卷积核。因此他们用的是concat,增加特征图的数量(基于通道数叠加)。

 

 

  • 3
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值