【人工智能】— 深度神经网络、卷积神经网络(CNN)、多卷积核、全连接、池化

本文介绍了深度神经网络的训练方法,如预训练和微调,以及卷积神经网络(CNN)的核心概念,包括卷积、多卷积核、参数共享和最大池化。CNN通过多卷积核提取不同特征,全连接层连接各个特征,最大池化用于降低维度。激活函数和反向传播在训练中起到关键作用。文章还提及了不同CNN架构如LeNet-5、AlexNet等。
摘要由CSDN通过智能技术生成

深度神经网络训练

Pre-training + Fine-tuning

  • Pre-training(预训练):
    监督逐层训练是多隐层网络训练的有效手段, 每次训练一层隐层结点, 训练时将上一层隐层结点的输出作为输入, 而本层隐结点的输出作为下一层隐结点的输入, 这称为”预训练”.
  • Fine-tuning(微调):
    在预训练全部完成后, 再对整个网络进行微调训练. 微调一般使用BP算法.
  • Comments:
    预训练+微调 的做法可以视为将大量参数分组, 对每组先找到局部看起来比较好的设置, 然后再基于这些局部较优的结果联合起来进行全局寻优.

训练深度神经网络

参数共享

参数共享是深度神经网络中的一种技术,它使多个神经元在网络中使用相同的参数集。这种技术有助于减少训练网络所需的参数数量,从而提高其计算效率。

卷积神经网络(CNN)

CNN是一种层次特征提取器,用于提取越来越高层次的特征。由于特征的感受域越来越大,特征从局部变为全局。
在这里插入图片描述

卷积

卷积是指对两个函数进行加权求和的操作。在卷积神经网络中,卷积操作是指将输入数据与一个卷积核(也称为滤波器或权重)进行卷积计算,得到一个特征映射的过程。

具体来说,卷积操作包括以下三个要素:

  • 输入数据:需要进行卷积计算的数据。
  • 卷积核:用于对输入数据进行卷积的权重参数。
  • 特征映射:经过卷积操作得到的输出结果。

在这里插入图片描述
在这里插入图片描述

多卷积核

在卷积神经网络中,通常会在每一层使用多个卷积核(也称为过滤器或滤波器)来提取不同的特征。这是因为只使用一个卷积核无法充分提取输入数据的全部信息,而使用多个卷积核可以提取更多的特征信息。

如果只使用一个卷积核来提取特征,则可能会忽略输入数据中的其他特征信息,从而导致信息丢失。而使用多个卷积核可以提取更多的特征信息,并且可以通过堆叠这些特征来形成更高级别的特征表示。高级别的特征通常是由低级别的特征组合而成的,这也是为什么需要使用多个卷积核的原因。

卷积

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

全连接

在这里插入图片描述
在这里插入图片描述

最大池化

在这里插入图片描述

卷积+池化

在这里插入图片描述

拉平向量

在这里插入图片描述

在这里插入图片描述

激活函数

在这里插入图片描述

优化

  • 当计算从输出到输入的参数梯度时,这就是为什么它被称为反向传播。
  • 由于卷积本质上是加权和,CNN的BP类似于全连接网络的BP。

小结

  • CNN是分层特征提取器,高层特征是下层特征的组合。
  • 卷积是所有输入通道的加权和
  • CNN最常用的激活是ReLU
  • CNN最常用的池化策略是最大池化
  • 训练策略是BP
  • 在验证集中找到导致最大响应的补丁是可视化特征的一种非常简单的方法。
  • LeNet-5、AlexNet、GoogleNet、VGG-Net、ResNet、BN
  • 在这里插入图片描述
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

之墨_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值