Pytorch：卷积神经网络-NiN

宅家的小魏

已于 2022-02-13 17:21:16 修改

阅读量456

点赞数

分类专栏： PyTorch 文章标签： pytorch cnn 深度学习计算机视觉神经网络

于 2022-02-04 00:25:16 首次发布

本文链接：https://blog.csdn.net/weixin_44979150/article/details/122778833

版权

Pytorch: 网络中的网络-NiN

Copyright: Jingmin Wei, Pattern Recognition and Intelligent System, School of Artificial and Intelligence, Huazhong University of Science and Technology

Pytorch教程专栏链接

文章目录

Pytorch: 网络中的网络-NiN

@[toc]

Reference

NiN 网络

NiN 网络搭建

NiN 块

NiN 模型

本教程不商用，仅供学习和参考交流使用，如需转载，请联系本人。

Reference

NiN论文原文链接

NiN 网络

前几节介绍的 LeNet、AlexNet 和 VGG 在设计上的共同之处是：先以由卷积层构成的模块充分抽取空间特征，再以由全连接层构成的模块来输出分类结果。其中，AlexNet 和 VGG 对 LeNet 的改进主要在于如何对这两个模块加宽（增加通道数）和加深。本节我们介绍网络中的网络(NiN)。它提出了另外一个思路，即串联多个由卷积层和“全连接”层构成的小网络来构建一个深层网络。

import torch
import torch.nn as nn

# 模型加载选择GPU
# device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
device = torch.device('cpu')
print(device)
# print(torch.cuda.device_count())
# print(torch.cuda.get_device_name(0))

cpu

NiN 网络搭建

NiN 块

我们知道，卷积层的输入和输出通常是四维数组（样本，通道，高，宽），而全连接层的输入和输出则通常是二维数组（样本，特征）。如果想在全连接层后再接上卷积层，则需要将全连接层的输出变换为四维。回忆之前（多输入通道和多输出通道）里介绍的 $1 \times 1$ 卷积层。它可以看成全连接层，其中空间维度（高和宽）上的每个元素相当于样本，通道相当于特征。因此，NiN使用 $1 \times 1$ 卷积层来替代全连接层，从而使空间信息能够自然传递到后面的层中去。下图对比了 NiN 同 AlexNet 和 VGG 等网络在结构上的主要区别。