1.3个3*3相较于1个7*7---非线性,参数量
2.3*3和1*1---上下文捕捉很重要
3.分类
- 训练时S=256,S=384
S属于[256,384]
- 测试1.深度
- 2.测试时用固定尺寸,训练时用尺寸抖动的效果优于训练时用固定尺寸
- 3.网络融和效果更佳
4.定位
- SCR,共享回归函数
- PCR,每一类用一个回归函数
- 训练1.损失函数换成欧式距离
- 2.S=256,S=384
- 3.微调所有层还是微调前两个全连接层
- 测试1.PCR,微调所有层效果好
- 2.对整个图像进行密集计算比仅对图像的中心剪裁应用密集计算效果好
- 3.网络融和
0.摘要:
研究:
- 网络深度对识别精度的影响
贡献:
- 对增加深度的网络进行了彻底的评估
- 网络泛化能力好
1.引言
2.网络
所有的网络层用相同的原则进行配置
2.1结构
- 输入尺寸固定为224*224,预处理(per-procession)时计算各通道的均值,然后逐像素减去该均值。
- 用于卷积操作的卷积核尺寸为33,也有11卷积核。
- 卷积步长(stride