EfficientNet基础网络模型结构如下,除了常规的卷积、池化、全连接之外,其最重要的模块就是MBConv。
MBConv的具体结构如下图所示:
其主要引入了SE通道注意力机制和跳跃连接。SE模块通过显式建模信道之间的相互依赖性来自适应地重新校准信道特性响应,通过该机制,网络可以学习使用全局信息来选择性地强调信息特征并抑制不太有用的特征。而跳跃连接可以有效解决网络训练过程中可能出现的梯度消失问题,有利于构建更深的网络。
通过多个MBConv的叠加,即可提取出有效的图像深层特征。随后将图像特征展开成一维向量,再经过全连接层和softmax之后即可得到输出向量,即可得到输入图片属于每个类别的置信度。