视觉核心项目物体检测实战
神经网络
整体架构
层次结构
全连接
非线性
激活函数引入非线性
卷积神经网络
整体架构
输入层
卷积层
卷积核大小33,卷积核有两个,
因为有RGB三个通道,每组卷积核有三个
最终输出为33*2,卷积核中的权重是可以更新的,更新权重,寻找的目标在发生变化
池化层
基于经典网络架构训练图像分类模型
RES-NET
增加残差模块,至少不比原来差,能够增加网络的深度
model_name='resnet'#可选的比较多['resnet','alexnet','vgg','squeezenet']
BN:batchnorm
标准化x-u/σ,使数据分布更加集中,模型能够更好的学习
每一层数据的分布是不同的,因此每一层都要进行标准化操作
优化器设置
Adam
optimizer_ft=optim.Adam(params_to_update,lr=le-2)#需要指定训练的参数
动量
下一次学习时,学习一些上次学习的知识
paper with code