一般框架
卷积->激活->池化->全连接层
其中卷积、激活、池化组合用于提取特征,全连接层用于得到最终结果进行分类
基本结构
输入层
卷积层CONV
卷积的目的是提取输入的不同特征
卷积核(filter/kernel):对输入图像中一定大小的部分进行遍历,同一卷积核中的数据与该卷积核的权值相乘累加,得到1个数据。卷积核的行和列一般为奇数,方便于定位
步长(stride):卷积核在图片上一次移动的距离
填充(padding):由于卷积后得到的数据尺寸会缩小,所以对图像边缘进行填充一圈0再卷积,使得图像维度保持不变,同时由于卷积时图像边缘的特征只被注意到一次,填充后可以更好地收集到边缘的特征
激活层RELU
池化层Pooling
全连接层FC
使用多个参数不同的卷积核卷积得到的多个特征图,将特征图打平展开,拼接成一维向量,作为全连接层的输入
例如打平得到的一维向量为80*1的大小,那么则有80个神经元,而输出层的神经元个数即为需要得到的目标的个数,比如二分类,即为2个神经元,那么就构建起全连接层,得到输出结果,一般对于输出通过softmax函数得出分类的概率
得到的输出结果和样本标签的对比,得到损失函数,进而进行反向传播,对各种参数进行调整,更新网络权重