- 避免信息瓶颈:
卷积过程中,HxW逐渐变小,输出通道数C逐渐增多。HxWxC 要缓慢变小
- 通道(卷积核)数量保持在可控范围内
输入通道数量C,输出通道数量K,参数数量HxWxCxK;复杂度正比于 : C x K
- 感受野要足够大:
卷积是基于局部图片的操作;捕捉大尺寸内容
多个小尺寸卷积核 vs 一个大尺寸卷积核
参数少,计算快;多个非线性激活
- 分组策略 -- 降低计算量
G组M/G个滤波器 vs M个滤波器
通道拆分 -- 分组卷积 -- 特征合并
- 低秩分解 -- 降低参数&计算量
空间分解:垂直 - 水平 - 垂直
通道分解: 分组 × NIN