李沐-26 网络中的网络 NiN【动手学深度学习v2】

Cai_CS_stu

已于 2024-04-19 15:57:24 修改

阅读量504

点赞数 3

分类专栏：李沐-动手深度学习文章标签：深度学习人工智能

于 2024-04-19 15:52:23 首次发布

本文链接：https://blog.csdn.net/ADDDDDDS/article/details/137967665

版权

主要记载关于全局平均池化层（Global Average Pooling, GAP）中如下两点的理解：

1. GAP的原理

2. 相对于全连接层，GAP具有更少的参数

为了直观地说明全局平均池化层相对于全连接层具有更少的参数，我们可以构造一个简单的例子。假设有一个卷积神经网络（CNN）的输出层前是一个特征图（Feature Map），其维度为 C×H×W，其中：

- C 是通道数（Channel Number），代表特征图的深度。
- H 和 W 分别是特征图的高度和宽度。

现在我们要将这个特征图映射到一个分类任务的输出向量，该向量的长度为N（代表类别数）。

1. **使用全连接层（FC）**：
全连接层会对输入的每个样本（即特征图）的所有元素进行线性变换，生成输出向量。若特征图大小为C×H×W ，则输入的总元素数为C×H×W 。全连接层与输入的每个元素都对应一个权重，再加上一个偏置项，因此该全连接层所需的参数总数为：

其中，前一部分是权重参数，后一部分是偏置参数。

2. **使用全局平均池化层（GAP）**：
全局平均池化层对每个通道（

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Cai_CS_stu

关注关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

李沐【动手学深度学习】23-27卷积神经网络笔记（LeNet、AlexNet、VGG、NiN、GoogLeNet）笔记

m0_46180925的博客

02-04

424

LeNet是最早发布的卷积神经网络之一，目的是识别图像中的手写数字。

跟李沐学AI-动手学深度学习-现代卷积神经网络

哇哈哈哈的博客

09-22

1545

AlexNet 深度学习之前最火的是机器学习：特征提取。选择核函数来计算相关性。凸优化问题。漂亮的定理。计算机视觉方面之前关注的不是机器学习而是几何学：抽取特征。描述几何（例如多相机），（非）凸优化。漂亮定理。假设满足了，效果很好。在十几年前，计算机视觉中最重要的是特征工程：特征工程是关键。特征描述子：SIFT，SURF。视觉词袋（聚类）。最后用 SVM。数据集ImageNet(2010)：自然物体的彩色图片。 AlexNet赢得了2012年ImageNet竞赛。

参与评论您还未登录，请先登录后发表或查看评论

卷积神经网络---池化层

weixin_45698190的博客

10-10

3971

在神经网络中，我们经常会看到池化层，常用的池化操作有四种：mean-pooling（平均池化），max-pooling（最大池化）、Stochastic-pooling（随机池化）和global average pooling（全局平均池化），池化层有一个很明显的作用：减少特征图大小，也就是可以减少计算量和所需显存。 ***mean-pooling（平均池化）：***即对邻域内特征点只求平均优缺点：能很好的保留背景，但容易使得图片变模糊正向传播：邻域内取平均反向传播：特征值根据领域大小被平均，然后传

全局平均池化 - 从特征图到全局信息

一个兴趣使然CVer的博客

10-16

3918

全局平均池化是一种将整个特征图的信息进行汇聚的池化操作。其中，全局平均池化是一种简洁而有效的方法，可以将整个特征图的信息进行汇聚。全局平均池化是一种简洁而有效的特征汇聚方法，适用于卷积神经网络的最后一层或倒数第二层。希望这篇博客能够帮助你理解全局平均池化的重要性和应用，以及它在卷积神经网络中的作用。通过这段代码，你可以了解全局平均池化的具体实现方式，并在自己的项目中应用这一操作。通过使用全局平均池化，我们可以在构建卷积神经网络时提高计算效率，减少模型复杂性，并获得更好的泛化能力。

全局平均池化（Global Average Pooling）

热门推荐

梁小憨憨的博客

02-08

2万+

最近看论文，看到了全局平均池化，之间见过这东西，但是没有仔细了解，今天学习一下，并记录下来，方便以后查阅。

GAP(全局平均池化层)操作

hanhan的博客

09-15

1万+

转载的文章链接：为什么使用全局平均池化层？关于 global average pooling https://blog.csdn.net/qq_23304241/article/details/80292859 在卷积神经网络的初期，卷积层通过池化层（一般是最大池化）后总是要一个或n个全连接层，最后在softmax分类。其特征就是全连接层的参数超多，使模型本身变得非常臃肿。之后，有大牛在NIN（Network in Network）论文中提到了使用全局平局池化层代替全连接层的思路，以下是摘录的一.

Network in Network学习笔记

xjz18298268521的博客

12-14

7973

论文:《Network in Network》概述：　　此论文是2014年的一篇比较厉害的paper，该论文改进了传统的cnn网络使得网络模型参数很少，也为后续的Googlenet和resnet以及目标检测网络中提出的全卷积共享提供了一个很好的开端，小菜也是在学习主流的深层网络模型的论文时发现许多论文中都有提到NIN这篇论文，所以专门挑了时间看了这篇论文，觉得这篇论文的确不错，论文中的网络整

个人学习笔记6-1：动手学深度学习pytorch版-李沐

浪子L的博客

09-08

1604

主要记录学习笔记，学习书目为李沐老师的《动手学习深度学习》重预备知识开始记录。开源书籍地址：https://zh-v2.d2l.ai/chapter_preface/index.htmll 李沐老师B站视频：https://space.bilibili.com/1567748478/channel/seriesdetail?sid=358497

卷积神经网络CNN各种模型（李沐老师的课程笔记——动手学）

qq_41732756的博客

08-11

855

不同神经网络模型 LeNet AlexNet 2012 2012年 sigmoid变成了ReLU（减缓梯度消失）隐藏全连接层后加入了丢弃层数据增强新加入丢弃法，最大池化层 VGG 2013 更大更深的AleNetx（重复的VGG块）将卷积层组合成块 NIN 全连接层太贵，参数太多容易过拟合但卷积层后的的一个全连接层的参数非常大 1x1卷积层来替代全连接层 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zRclJs

全局平均池化

boy854456187的博客

03-08

1610

文章目录一、作用和优点二、Tensorflow实现参考文献一、作用和优点首次提出全局平均池化概念的论文是：Network In Network, 作用和优点都讲的很清楚。在这里插入图片描述：作用：如果要预测K个类别，在卷积特征抽取部分的最后一层卷积层，就会生成K个特征图，然后通过全局平均池化就可以得到 K个1×1的特征图，将这些1×1的特征图输入到softmax layer之后，每一个输出结果代表着这K个类别的概率（或置信度 confidence），起到取代全连接层的效果。优点： - 和全

全局平均池化层（GLP）

SmartDemo的博客

04-01

1万+

一、全局平均池化 全局平均池化层（GAP）在2013年的《Network In Network》（NIN）中首次提出，于是便风靡各种卷积神经网络。为什么它这么受欢迎呢？一般情况下，卷积层用于提取二维数据如图片、视频等的特征，针对于具体任务（分类、回归、图像分割）等，卷积层后续会用到不同类型的网络，拿分类问题举例，最简单的方式就是将卷积网络提取出的特征（feature map）输入到softmax全连接层对应不同的类别。首先，这里的feature map是二维多通道的数据结构，类似于三个通道（红黄...

卷积神经网络中关于全局平均池化代替全连接层、以及参数计算等的一些思考

Amigo_1997的博客

05-10

5650

一、引发思考的实验与问题：在一个非常小的二分类样本集（样本总数目63，“10-crop”法数据增强10倍，样本为矩阵保存为图片），通过ALexNet模型和VGG模型做分类任务，无论怎么调超参数，留出法重复50次的实验情况大致都如图A所示，而用Inception_v1的效果可以达到如图B所示。我就很奇怪为什么效果会差别这么大？按道理就算inception_v1模型有多尺度（并联卷积层）的设计思想，准确率和AUC的值是会提升，但不会提升这么多，而且在训练集的效果差距也太大了。为了研究这个问题，我首先

全连接层（FC）与全局平均池化层（GAP）

weixin_33672109的博客

05-16

1万+

在卷积神经网络的最后，往往会出现一两层全连接层，全连接一般会把卷积输出的二维特征图转化成一维的一个向量，全连接层的每一个节点都与上一层每个节点连接，是把前一层的输出特征都综合起来，所以该层的权值参数是最多的。例如在VGG16中，第一个全连接层FC1有4096个节点，上一层POOL2是7*7*512 = 25088个节点，则该传输需要4096*25088个权值，需要耗很大的内存。又如下图：最...

深度学习之卷积神经网络入门

最新发布

2201_75345884的博客

04-25

534

loss_fn=nn.CrossEntropyLoss() #创建交叉熵损失函数对象，因为手写字识别中一共有10个数字，输出会有10个结果optimizer=torch.optim.Adam(model.parameters(),lr=0.01) #创建一个优化器# #params:要训练的参数，一般我们传入的都是model.parameters()# lr:learning_rate学习率，也就是步长是交叉熵损失函数，适用于多分类任务，用于计算模型预测结果与真实标签之间的差距。

深度学习--自然语言处理统计语言与神经语言模型

m0_65065095的博客

04-25

1083

传统的语言模型是基于词袋模型（Bag-of-Words）和one-hot编码展开工作的，即在传统的语言模型中要生成一个句子，其实是拿一堆词语进行拼凑，拼凑出一个句子后我们需要有一个评委来对这个机器生成的句子进行打分和评价，语言模型就是这么一位评委，它会给每个句子打出一个概率值，以表明他们与人类语言的接近程度。

基于深度学习Yolo8的驾驶员疲劳与分心行为检测系统

XiaoCoder的博客

04-23

222

③：技术栈：Python、PySide6、OpenCV、YOLOv8、Matplotlib、NumPy。②：开发环境：Python3.8+、PyCharm/VSCode。①：疲劳检测：眨眼频率监测、哈欠检测、Perclos模型评分。②：分心行为识别：手机使用检测、抽烟行为检测、喝水行为检测。④：数据统计：行为数据可视化、疲劳指标统计、数据导出功能。①：系统环境：Windows/Mac/Linux。③：实时监控：摄像头实时画面显示、状态实时更新。【三】疲劳检测模型与行为分析统计。

2025-04-22 李沐深度学习5 —— 线性回归

zheliku的博客

04-22

1294

在美国买房时，买家需根据房屋信息（如卧室数量、卫生间数量、面积等）预测合理的成交价。输入数据：房屋特征（如X1=卧室数X2=卫生间数X3=面积输出目标：预测成交价Y。实际挑战：卖家的标价和网站估价（如Redfin）仅为参考，最终需通过竞价决定成交价，因此准确预测至关重要。计算输入特征X\mathbf{X}X和模型权重w\mathbf{w}w的矩阵-向量乘法后加上偏置bbb。注意，上面的XwXw是一个向量，而bbb是一个标量。

卷积神经网络基础（四）

qq_52889317的博客

04-22

1103

今天我们继续学习各个激活函数层的实现过程。

TM2SP-Net阅读

qq_49130177的博客

04-22

449

TCSVT 2025。