经典的CNN网络模型概述

接下来几天,将把自己最近读的关于图片分类的经典网络模型论文整理一遍。大概做个摘要。这些论文都是在imagenet上1.2 million数据训练出来的。

由于从这些预训练的网络训练的deep feature有良好的泛化能力,可以应用到其他不同的CV问题,而且比传统的hand-craft feature要好,所以得到广泛应用。

 

从AlexNet论文说起,ImageNet Classification with Deep Convolutional Neural Networks。

在ImageNet LSVRC-2010 2012表现突出

top-1误差率37.5%,以及top-5误差率17.0%

网络有6000万个参数和650,000个神经元

网络结构五个卷积层,以及某些卷积层后的池化层,以及最后的三个全连接层

引入正则化方法dropout

ReLU修正线性单元的引入,比tanh等要快的多

论文地址:https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf

 

接下来的NIN论文,Network In Network 

NIN利用Global average pooling去掉了FC layer, 大大减少了模型大小

利用网络中的网络思想

论文地址:https://arxiv.org/pdf/1312.4400v3.pdf

 

VGG模型论文,VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

可以看成是加深版本的AlexNet. 都是conv layer + FC layer

论文地址:https://arxiv.org/pdf/1409.1556.pdf

 

GoogLeNet模型,也称inceptionV1 Going Deeper with Convolutions

受NIN启发,各种sub-network和inception结构的设计,通过精心设计的设计实现的,允许增加网络的深度和宽度,提高了网络内部计算资源的利用率。

将1x1,3x3,5x5的conv和3x3的pooling,stack在一起,一方面增加了网络的width,另一方面增加了网络对尺度的适应性。

论文地址:http://arxiv.org/abs/1409.4842

 

InceptionV2论文 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift

改进V1,加入了BN层,减少了内部neuron的数据分布发生变化也就是文中说的Internal Covariate Shift,每一层的输入都服从N(0, 1)的高斯分布。

同是受到VGG启发用2个3x3的conv替代inception模块中的5x5,既降低了参数数量,提高训练速度。

论文地址: http://arxiv.org/abs/1502.03167

 

inceptionV3论文 Rethinking the Inception Architecture for Computer Vision

在v2的基础上改进是使用了分解(Factorization),将7x7分解成两个一维的卷积(1x7,7x1),将3x3分解成两个一维的卷积(1x3,3x1),加速计算的同时使得网络深度增加和网络的非线性更强。

网络输入从224x224变为了299x299,还设计了35x35/17x17/8x8等模块。

论文地址:http://arxiv.org/abs/1512.00567

 

inceptionV4论文 Inception-ResNet and the Impact of Residual Connections on Learning

Inception模块结合Residual Connection可以极大地加速训练,同时性能也有提升。

开源了Inception-ResNet v2网络模型后,经过优化精简Inception v4模型,相比Inception-ResNet v2网络模型性能差不多,但是网络复杂程度降低。

论文地址:http://arxiv.org/abs/1602.07261

 

Resnet模型论文,Deep Residual Learning for Image Recognition

引入残差,解决深层次的网络带来acc下降问题

论文地址:https://arxiv.org/pdf/1512.03385v1.pdf

 

转载于:https://www.cnblogs.com/vincentqliu/p/7465150.html

CNN,即卷积神经网络(Convolutional Neural Networks),是一种深度学习模型,广泛应用于图像识别、处理和分类任务。它是深度学习领域的一个重要分支,与传统的神经网络相比,CNN通过引入卷积层,可以更好地处理局部和上下文信息,并且具有很好的空间适应性。 CNN的主要特点包括: 1. 卷积层:CNN的核心在于卷积层,该层利用滑动窗口在输入数据上滑动,同时对窗口附近的像素进行加权平均得到该位置的卷积结果。这种操作能够有效地捕捉输入数据中的局部和上下文信息。 2. 池化(Pooling)技术:卷积神经网络通常结合池化技术以减少特征地图的大小,并保持某些区域的权重比其他区域更高,这在神经网络中引入了空间下的“稀疏性”。 3. 深度:CNN通常具有多层的卷积层和池化层,这使得CNN具有很强的特征学习和分类能力。随着网络深度的增加,CNN能够学习到越来越复杂的特征表示。 4. 适应性:CNN对输入数据的形状具有适应性,这意味着它可以轻松处理不同形状和大小的输入数据。 卷积神经网络在计算机视觉、自然语言处理、机器人视觉等领域有广泛应用,尤其是在图像分类、目标检测、图像生成等领域表现出了强大的性能。虽然CNN已经取得了许多成功,但它仍在不断发展和改进,如使用自注意力机制、跨通道信息融合等新技术,以进一步提高性能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值