OctConv

首先参考

https://mp.weixin.qq.com/s/NthR9-iE2jqgufnBtToOHA

然后参考原文

补充理解

(1)这里的核心思想就是低频特征图和高频特征图,在概念上是可以理解的,符合人的思维习惯。在实施上述思想的过程中。对于低频特征图 就选择压缩,压缩之后,特征图的size就会减半!
(2)同时低频特征图和高频特征图之间有交流。高频特征图到低频特征图 就是pooling。低频特征图到高频特征图就是上采样
(3)控制低频图和高频特征图和高频特征图的通道比例就是alpha
注意:在文中 似乎是除了第一层和最后一层,其他的层都是alpha in=alpha out
而第一层中alpha in=0 alpha out=alpha
最后一层 alpha in=alpha alpha out=0
(4)理论上说alpha in与alpha out是独立的
但是由于低频和高频之间的交流文中选择的是pooling和upsampling,这一点限制了alpha in=alpha out
一旦去除低频和高频之间的交流或者采用卷积实现交流,alpha in、alpha out就可以独立取值了

期待

(1)之后待做的工作 可以用神经网络搜索 得到超参数alpha在不同阶段的分布情况,进而可以指导更多工作。
(2)这种结构能否提高目标检测的效果,毕竟 他区分了 高频和低频特征图。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值