提特征的模块一般称为backbone,可以说特征提取就是深度学习最为核心的东西。而EfficientNet系列模型是谷歌大脑在2019年提出,该模型探索了网络深度,宽度,图片分辨率对准确率的影响,提出了符合模型扩张的方法平衡深度,宽度,分辨率之间的关系。
EfficientNet基本网络结构
用强化学习对参数进行调整,而不是遍历去调整参数。(参数搜索NAS)H*W,C特征图大小,Layers特征图大小。
MBConv(depthwise)深度可分离卷积
目的是减少减少卷积过程中的参数,不用想传统filter与每一channel做卷积然后相加。DW特征图是一对一的。在Map后加上N个11的普通卷积,可以保证特征图的输出个数。
这样做特征会减小,但是参数也会减少,用11卷积把特征补起来。
SE模块
也就是将卷积后得到的特征图看成是序列加入到注意力机制模块,得到每个111特征图的权重参数。(个人理解)