初始卷积神经网络CNN

最新推荐文章于 2021-10-09 16:40:50 发布

Bread Sir

最新推荐文章于 2021-10-09 16:40:50 发布

阅读量234

点赞数

分类专栏： Deep Learning Tutorial 文章标签： CNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/karry_zzj/article/details/102723195

版权

Deep Learning Tutorial 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

学习深度学习一定要学习CNN，而CNN的发展非常快，从 LeNet 到 AlexNet 到 VGG 到 GoogleNet 再到 ResNet 再到 DenseNet，学习这些经典的网络首先需要了解卷积神经网络的相关知识。

下图就是LeNet的网络结构，如果你不懂CNN，是完全不明白这到底是个什么东西的。
在这里插入图片描述

Why CNN

首先，我们使用神经网络可以实现回归求解，图片的识别当然也是可以使用神经网络来求解。

但之前我们使用了全连接的多层感知机，试想一下，一张图片RGB共3个channels，维度为1000 × 1000 × 3，那么输入就有300万之多，若每个输入单元与隐藏层的每个权重单元（假设共有1000个隐藏单元）进行相乘，那么最后矩阵大小就有1000 × 300万，即30亿个参数，这是一个非常巨大的数字，所以使用全连接网络是不现实的。

所以人们相出了一种卷积计算，先从边缘检测引入它。

边缘检测示例

从网上随便一张图片：

那么它的边缘检测就是吴磊的半身轮廓。因为图片由像素组成，所以每个轮廓的像素和周围的像素是不同的，如何进行检测呢？这就需要提到卷积运算了。

二、重要概念

1. 卷积运算

卷积运算是将输入和核函数进行对应相乘并相加，图示如下：

而卷积运算有以下重要的思想：

稀疏交互：边缘检测在整个图像上来说是稀疏的
参数共享：权重被计算多次
等变表示： $f (g (x)) = g (f (x))$

2. 卷积层的组成

卷积层由以下部分组成：

卷积计算：就是上面图片所示
卷积核kernel
边界填充padding
步长stride

当图像输入大小为 $n \times n$ ，卷积核大小为 $f \times f$ 时，输出的大小为 $(n - f + 1) \times (n - f + 1)$
当加入padding( $p$ )后，输出的大小为 $(n + 2 p - f + 1) \times (n + 2 p - f + 1)$
若加入stride( $s$ )，则输出的大小为 $\lfloor{\frac{(n+2p-f)}{s}+1}\rfloor × \lfloor{\frac{(n+2p-f)}{s}+1}\rfloor$

3. 激活函数

在LeNet中使用的是sigmoid，也可以使用tanh，但是到了AlexNet中提出了使用ReLU这个激活函数，为什么呢？因为它要比tanh更快达到低错误率。

4. Pooling

Pooling是为了提取一定区域的主要特征，并减少参数数量，一般采用两种池化层：MaxPooling和AveragePooling。
下图采用的是MaxPooling：

三、CNN结构组成

卷积层Conv
池化层Pooling
全连接层FC

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
初始卷积神经网络CNN

学习深度学习一定要学习CNN，而CNN的发展非常快，从 LeNet 到 AlexNet 到 VGG 到 GoogleNet 再到 ResNet 再到 DenseNet，学习这些经典的网络首先需要了解卷积神经网络的相关知识。下图就是LeNet的网络结构，如果你不懂CNN，是完全不明白这到底是个什么东西的。Why CNN首先，我们使用神经网络可以实现回归求解，图片的识别当然也是可以使用神经网...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。