ImageNet Classification with Deep ConvolutionalNeural Networks

最新推荐文章于 2024-05-26 21:49:12 发布

置顶 hustlx

最新推荐文章于 2024-05-26 21:49:12 发布

阅读量1.3k

点赞数

分类专栏：论文笔记

本文链接：https://blog.csdn.net/HUSTLX/article/details/51712458

版权

论文笔记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

ImageNet Classification with Deep ConvolutionalNeural Networks

ReLU(Rectified Linear Units (ReLUs))激活函数的优势：从用梯度下降法的训练时间角度来看，双曲正切或者sigmoid函数这类饱和非线性函数要比ReLU：f=max(0,x)这个非饱和的非线性函数要慢的多(好几倍的速度)。

Local Response Normalization：实验发现用下式归一化能降低错误率。

Overlapping Pooling：实验发现用有重叠的pooling能降低错误率，而且不易过拟合。

网络结构：5层卷积层，3层全连接层，最后一层全连接输入到1000个类的多类逻辑回归softmax分类器。具体来说，输入224*224*3的图像，第一个卷积层96个核，大小11*11*3（因为RGB三个图层，96个11*11*3的卷积核生成的特征图map为96个55*55图，注意11*11*3的卷积核具体操作的时候就是用11*11的卷积核去卷积每个输入图层然后再把得到的所有图对应位置相加得到这个卷积核的特征图），步长为4，然后跟局部归一化加max-pooling，第二个卷积层256核，大小5*5*48（因为第一层96张map分到2个GPU上，每个48张图，所以卷积大小5*5*48，得到256个大小27*27的图），加局部归一化和max-pooling，三四五层卷积均没有局部归一化和max-pooling。第三层卷积层384核，大小3*3*256（因为第三层卷积层连着两个GPU的第二层卷积，所以共256张图的输入，输出为384张13*13的特征图），第四卷积层384核3*3*192（因为第三层384张图分到两个GPU上，每个192张图，生成384个13*13的特征图），第五层卷积层256核3*3*192（256张特征图），全连接层4096个神经元。

减少过拟合的方法：a、增大数据集：一是从原始256*256的图像上随机切割224*224的patch。将数据集增大了2048倍。二是在RGB颜色分量加高斯扰动，使得物体识别对于强度和颜色亮度不敏感。这个方法减少了1%的错误率。b、Dropout：对于每个隐含层神经元，其输出以0.5的概率置0.被Dropout的神经元对网络的前向传播无贡献，不参加反向传播。这个技术减少了复杂的神经元之间依赖性，因为一个神经元不能依赖其他特定神经元的表现。这使得网络强迫学习一些更加鲁棒性的特征。在第二层全连接层用了dropout。

训练：对权重用0均值0.01方差高斯初始化，对于第二四五层、全连接层偏置初始化为1，这使得ReLU输入为正从而加速了学习过程。其他偏置初始化为0；

hustlx

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ImageNet Classification with Deep ConvolutionalNeural Networks

ImageNet Classification with Deep ConvolutionalNeural NetworksReLU(Rectified Linear Units (ReLUs))激活函数的优势：从用梯度下降法的训练时间角度来看，双曲正切或者sigmoid函数这类饱和非线性函数要比ReLU：f=max(0,x)这个非饱和的非线性函数要慢的多(好几倍的速度)。
复制链接

扫一扫

专栏目录