接下来几天,将把自己最近读的关于图片分类的经典网络模型论文整理一遍。大概做个摘要。这些论文都是在imagenet上1.2 million数据训练出来的。
由于从这些预训练的网络训练的deep feature有良好的泛化能力,可以应用到其他不同的CV问题,而且比传统的hand-craft feature要好,所以得到广泛应用。
从AlexNet论文说起,ImageNet Classification with Deep Convolutional Neural Networks。
在ImageNet LSVRC-2010 2012表现突出
top-1误差率37.5%,以及top-5误差率17.0%
网络有6000万个参数和650,000个神经元
网络结构五个卷积层,以及某些卷积层后的池化层,以及最后的三个全连接层
引入正则化方法dropout
ReLU修正线性单元的引入,比tanh等要快的多
论文地址:https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf
接下来的NIN论文,Network In Network
NIN利用Global average pooling去掉了FC layer, 大大减少了模型大小
利用网络中的网络思想
论文地址:https://arxiv.org/pdf/1312.4400v3.pdf
VGG模型论文,VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION
可以看成是加深版本的AlexNet. 都是co