AlexNet
Krizhevsky et al. "ImageNet classification with deep convolutional Neural Networks " NIPS 2012
动机(Why)
ImageNet 图像分类竞赛中现有模型准确度不足,为了刷点
方法(How)
- 8层卷积神经网络
- 使用ReLU,比Sigmoid效率高上很多
- 数据增强:沿PCA主方向乘以随机系数向量,扩充数据
- 使用Local Response Normalization 局部响应归一化;作用在同层中相邻的通道之间,之后的VGG论文指出没啥意义,徒增计算量。
- 防止过拟合:使用重叠池化。后来都不这么做了,进一步说明浅层网络的超参调节策略不能迁移到深层网络中
- 防止过拟合:dropout 0.5, 测试阶段失活一般神经元,测试阶段使用所有的神经元,但是将神经元的输出乘以0.5
- minibatch size 128,按一批的平均梯度进行更新
- SGD Momentum 0.9
- 卷积层的偏置项为1,鼓励R