Datawhale AI 夏令营（第五期）李宏毅苹果书 Task 3 《深度学习详解（进阶）》

Mingrui-Sun

已于 2024-09-02 16:40:13 修改

阅读量145

点赞数 1

文章标签：人工智能深度学习机器学习

于 2024-08-24 14:43:14 首次发布

本文链接：https://blog.csdn.net/spring5/article/details/141499485

版权

Task 3.1 《深度学习详解》- 3.7 批量归一化

批量归一化（Batch Normalization，BN）是深度学习中常用的技术，旨在通过规范输入数据，改善网络训练效率和效果。本文将对 3.7 部分内容进行总结和分析，并探讨其优缺点以及潜在问题。

批量归一化通过以下方式影响深度学习模型：

BN 的核心思想是将每个批次的数据进行标准化处理，使其具有零均值和单位方差。具体步骤如下：

内部协变量偏移: BN 原始论文提出内部协变量偏移的概念，认为其是导致训练困难的主要原因。然而，后续研究表明，内部协变量偏移可能并非主要原因，BN 的效果可能来自于其对误差表面平滑性的影响。
批量大小的影响: BN 依赖于批量大小，当批量较小时，BN 的效果会下降。
可解释性: BN 的内部机制复杂，难以解释其对模型的影响。
训练时间: BN 需要计算均值和方差，增加了训练时间。
异常值: BN 对异常值敏感，可能导致训练不稳定。

卷积神经网络（CNN）的基本原理和设计思路，并以图像分类任务为例，解释了CNN相较于全连接网络的简化之处。以下是对文档内容的总结和分析，并针对其中一些问题提出疑问：

1. CNN 的简化：

感受野：CNN 通过设定感受野，将图像划分为多个区域，每个神经元只关注其对应的感受野内的信息。这大大减少了神经元的输入维度，从而降低了参数数量和过拟合风险。
共享参数：CNN 采用参数共享机制，即多个神经元共享相同的权重，这进一步减少了参数数量，并使得网络能够更好地识别图像中重复出现的模式。

2. 感受野的设计：

大小：感受野的大小可以根据模式的特点进行调整，例如 3x3、5x5 或 7x7 等。一般而言，较小的感受野可以捕捉局部特征，而较大的感受野可以捕捉更全局的特征。
步幅：步幅决定了感受野移动的距离，较大的步幅会导致感受野之间的重叠减少，从而丢失一些信息。较小的步幅则会增加感受野之间的重叠，但会增加计算量。
填充：为了防止感受野超出图像边界，可以在边界处进行填充，例如零填充或反射填充。

3. 参数共享的意义：

4. CNN 的优势：

5. 存在的问题和疑问：

6. 未来研究方向：

4.5 简化 1 和 2 的总结

全连接网络 vs. 卷积网络：文档首先对比了全连接网络和卷积网络的区别。全连接网络具有最大的灵活性，可以学习各种特征，但参数数量庞大，容易过拟合。卷积网络通过引入“感受野”和“参数共享”的概念，减少了参数数量，降低了过拟合风险，更适合处理图像数据。
卷积层的工作原理：卷积层包含多个滤波器，每个滤波器负责检测图像中的特定模式。滤波器通过在图像上滑动并计算局部区域的内积来提取特征，生成特征映射。
卷积网络的层级结构：卷积网络通常包含多个卷积层，每个卷积层的滤波器数量可以不同。随着层数的增加，网络可以检测更大范围的模式。

4.6 观察 3：下采样不影响模式检测