CNN卷积神经网络

最新推荐文章于 2025-04-07 11:31:02 发布

Walter_Silva

最新推荐文章于 2025-04-07 11:31:02 发布

阅读量677

点赞数

分类专栏：机器学习笔记集

本文链接：https://blog.csdn.net/Gin077/article/details/83715436

版权

机器学习笔记集同时被 2 个专栏收录

27 篇文章

订阅专栏

机器学习教程

15 篇文章

订阅专栏

1、MLP和CNN的区别

MLP丧失了二维图像信息，必须转成向量

2、将全连接层转换为局部连接层

stride和填充：stride步长，对于超出范围的区域，可以删除或者填充默认值，根据需要选择（pandding分别对应valid和same）

3、卷积层的维度

公式：卷积层中的参数数量

卷积层中的参数数量取决于 filters、kernel_size 和 input_shape 的值。我们定义几个变量：

K - 卷积层中的过滤器数量
F - 卷积过滤器的高度和宽度
D_in - 上一层级的深度

注意：K = filters，F = kernel_size。类似地，D_in 是 input_shape 元组中的最后一个值。

因为每个过滤器有 F*F*D_in 个权重，卷积层由 K 个过滤器组成，因此卷积层中的权重总数是 K*F*F*D_in。因为每个过滤器有 1 个偏差项，卷积层有 K 个偏差。因此，卷积层中的参数数量是 K*F*F*D_in + K。

公式：卷积层的形状

卷积层的形状取决于 kernel_size、input_shape、padding 和 stride 的值。我们定义几个变量：

K - 卷积层中的过滤器数量
F - 卷积过滤器的高度和宽度
H_in - 上一层级的高度
W_in - 上一层级的宽度

注意：K = filters、F = kernel_size，以及S = stride。类似地，H_in 和 W_in分别是 input_shape 元组的第一个和第二个值。

卷积层的深度始终为过滤器数量 K。

如果 padding = 'same'，那么卷积层的空间维度如下：

height = ceil(float(H_in) / float(S))
width = ceil(float(W_in) / float(S))

如果 padding = 'valid'，那么卷积层的空间维度如下:

height = ceil(float(H_in - F + 1) / float(S))
width = ceil(float(W_in - F + 1) / float(S))

4、池化层：维度过高，参数就会过多，就容易过拟合，所以用池化层降维

有最大池化层和全局平均池化层等

5、CNN架构设计

卷积层：使得穿过卷积层的数组更深

池化层：用于减小空间维度

flatten之后输入全连接层

比如

该网络以三个卷积层（后面跟着最大池化层）序列开始。前 6 个层级旨在将图片像素数组输入转换为所有空间信息都丢失、仅保留图片内容信息的数组。然后在 CNN 的第七个层级将该数组扁平化为向量。后面跟着两个密集层，旨在进一步说明图片中的内容。最后一层针对数据集中的每个对象类别都有一个条目，并具有一个 softmax 激活函数，使其返回概率。

6、图片增强

标度不变性：图片的大小

旋转不变性：图片的角度

平移不变性；在采集区的位置

通过对原图作平移、旋转，向训练集中添加更多新样本，也可以避免过拟合