深度学习笔记 DatawhaleX李宏毅苹果书 AI夏令营

最新推荐文章于 2024-09-29 22:27:37 发布

l__111

最新推荐文章于 2024-09-29 22:27:37 发布

阅读量491

点赞数 16

文章标签：人工智能深度学习笔记

本文链接：https://blog.csdn.net/l__111/article/details/141791081

版权

第4章卷积神经网络

图像描述：图像可以描述为三维张量（宽×高×通道数）。一张图像是一个三维的张量，其中一维代表图像的宽，另外一维代表图像的高，还有一维代表图像的通道（channel）的数目。
通道：彩色图像的每个像素由红色（R）、绿色（G）、蓝色（B）三个颜色通道组成，称为RGB色彩模型。
输入处理：将三维张量“拉直”成一个大向量，作为网络输入。
图像尺寸：默认输入图像尺寸为100像素×100像素。

定义：卷积神经网络会设定一个区域，即感受野（receptive f ield），每个神经元都只关心自己的感受野里面发生的事情，感受野是由我们自己决定的。
设计：感受野可以有大有小（如3×3、11×11），且可以只考虑部分通道。
感受野的范围不一定要相连，理论上可以有一个神经元的感受野就是图像的左上角跟右上角。
步幅（Stride）：感受野移动的量，通常设为1或2以保证重叠。
假设感受野完全没有重叠，如果有一个模式正好出现在两个感受野的交界上面，就没有任何神经元去检测它，这个模式可能会丢失，所以希望感受野彼此之间有高度的重叠。如令步幅=2，感受野就会重叠

填充（Padding）：处理边界问题，常用零填充。如果感受野有一部分超出图像的范围之外，就当做那个里面的值都是0。其实也有别的补值的方法，比如补整张图像里面所有值的平均值或者把边界的这些数字拿出来补没有值的地方

全连接网络是弹性最大的。全连接网络可以决定它看整张图像还是只看一个范围，如果它只想看一个范围，可以把很多权重设成0。

加上感受野的概念以后，只能看一个小范围，网络的弹性是变小的。

参数共享 又进一步限制了网络的弹性。

感受野加上参数共享就是卷积层 （convolutional layer），用到卷积层的网络就叫卷积神经网络

1. 感受野（Receptive Field）

2. 参数共享（Parameter Sharing）

滤波器：
- 滤波器是一个3×3×通道的张量，其中的数值是模型中的参数，通过训练得到。
- 滤波器在输入图像上滑动，通过内积运算检测特定模式，生成特征映射。
特征映射：
- 每个滤波器生成一个特征映射，特征映射的大小由输入图像的大小、滤波器的大小和步幅决定。
- 特征映射可以看作是输入图像经过滤波器处理后的新图像，只是通道数增加，每个通道对应一个滤波器。