深度学习入门（四）：卷积神经网络

最新推荐文章于 2024-05-29 21:40:10 发布

陈粑粑的小白鞋

最新推荐文章于 2024-05-29 21:40:10 发布

阅读量795

点赞数 1

分类专栏：深度学习文章标签： python 深度学习

本文链接：https://blog.csdn.net/qq_40840749/article/details/119298340

版权

4 篇文章 3 订阅

订阅专栏

学习资料来源：零基础入门深度学习(4) - 卷积神经网络

卷积神经网络（Convolutional Neural Network,CNN），是一种适用于语音识别、图像识别任务的神经网络结构，比如谷歌的GoogleNet、微软的ResNet等。

Relu函数的定义是：f(x)=max(0,x)，优势有速度快、减轻梯度消失问题及稀疏性等，图像如下图所示：

全连接网络	参数数量太多，没有利用像素之间的位置信息，网络层数限制
卷积网络	局部连接，权值共享，下采样

一个卷积神经网络由若干卷积层（卷积层的Filter数是一个超参数）、Pooling层、全连接层组成。常用架构模式为：

INPUT -> [ [CONV]*N -> POOL?]*M -> [FC]*K

三维的层结构：

卷积神经网络每层的神经元是按照三维排列的，有宽度、高度和深度。

卷积后的Feature Map大小和图像大小、步幅是有关系的。满足以下关系：

其中，W2是卷积后Feature Map的宽度，W1是卷积前图像的宽度，F是filter的宽度，P是Zero Padding（指在原始图像周围补几圈0）数量，S是步幅，H2是卷积后Feature Map的高度，H1是卷积前图像的宽度。

Pooling层主要的作用是下采样，通过去掉Feature Map中不重要的样本，进一步减少参数数量。常用的是Max Pooling，即在n*n的样本中取最大值作为采样后的样本值。

推导详见参考资料。

详见参考资料。

关注

专栏目录