PyTorch卷积层基础七问

最新推荐文章于 2024-04-28 00:03:29 发布

xingman510

最新推荐文章于 2024-04-28 00:03:29 发布

阅读量471

点赞数 1

文章标签： pytorch 深度学习 cnn

原文链接：https://mp.weixin.qq.com/s/2WvjRvWCB3z__9hgHqjuTQ

版权

1，普通卷积层的参数数量该如何计算？

普通卷积的操作分成3个维度，在空间维度(H和W维度)是共享卷积核权重，滑窗相乘求和(融合空间信息)，在输入通道维度是每一个通道使用不同的卷积核参数并对输入通道维度求和(融合通道信息)，在输出通道维度操作方式是并行堆叠(多种)，有多少个卷积核就有多少个输出通道。

普通卷积层的参数数量 = 输入通道数×卷积核尺寸(如3乘3)×输出通道数(即卷积核个数) + 输出通道数(考虑偏置时）

注：对于卷积核参数共享的理解

权值是卷积核里面的数，给定一张输入图片，用一个卷积核去扫描这张图，这张图的每个位置都是被同样的卷积核扫描的，所以权重是一样的，也就是共享。

2，卷积层的输出尺寸该如何计算？

卷积输出尺寸计算公式 o = (i + 2p -k)//s + 1

对空洞卷积 k' = d(k-1) + 1

o是输出尺寸，i 是输入尺寸，p是 padding大小，k 是卷积核尺寸，s是stride步长，d是空洞卷积dilation膨胀系数。

3，空洞卷积有什么作用？有什么缺点？

空洞卷积和普通卷积相比，空洞卷积可以在保持较小参数规模的条件下增大感受野，常用于图像分割领域。其缺点是可能产生网格效应，即有些像素被空洞漏过无法利用到，可以通过使用不同膨胀因子的空洞卷积的组合来克服该问题。

4，什么是分组卷积，分组卷积有什么作用？

和普通卷积相比，分组卷积将输入通道分成g组，卷积核也分成对应的g组，每个卷积核只在其对应的那组输入通道上做卷积，最后将g组结果堆叠拼接。由于每个卷积核只需要在全部输入通道的1/g个通道上做卷积，参数量降低为普通卷积的1/g。分组卷积要求输入通道和输出通道数都是g的整数倍。

5，什么是深度可分离卷积，和普通卷积相比深度可分离卷积有什么优点？

深度可分离卷积的思想是将融合空间信息和融合通道信息的操作在卷积中分成独立的两步完成。做法是先用g=m(输入通道数)的分组卷积逐通道作用融合空间信息，再用n(输出通道数)个1乘1卷积融合通道信息。其参数量为 (m×k×k)+ n×m, 相比普通卷积的参数量 m×n×k×k 显著减小。同时，由于深度可分离卷积融合空间信息与融合通道信息相互分离，往往还能比普通卷积取得更好的效果。

6，什么是转置卷积/反卷积？它有什么作用？

一般的卷积操作后会让特征图尺寸变小，但转置卷积(也被称为反卷积)可以实现相反的效果，即放大特征图尺寸。对两种方式理解转置卷积，第一种方式是转置卷积是一种特殊的卷积，通过设置合适的padding的大小来恢复特征图尺寸。第二种理解基于卷积运算的矩阵乘法表示方法，转置卷积相当于将卷积核对应的表示矩阵做转置，然后乘上输出特征图压平的一维向量，即可恢复原始输入特征图的大小。