深度学习面试总结-2 卷积与深度可分离卷积

最新推荐文章于 2024-05-08 20:13:53 发布

weixin_44351910

最新推荐文章于 2024-05-08 20:13:53 发布

阅读量238

点赞数

分类专栏：深度学习面试总结文章标签：深度学习 python 人工智能

本文链接：https://blog.csdn.net/weixin_44351910/article/details/126599941

版权

5 篇文章 0 订阅

订阅专栏

卷积过程就是卷积核在输入图像上滑动计算得到输出，滑动时对应点相乘，然后得到的结果相加，就是输出对应点的值。

下图为卷积核为3，步长为1和边界扩充的二维卷积结构：

torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, 
                dilation=1, groups=1, bias=True)

卷积核大小（Kernel Size）：定义了卷积操作的感受野。在二维卷积中，通常设置为3，即卷积核大小为3×3。

步幅（Stride）：定义了卷积核遍历图像时的步幅大小。其默认值通常设置为1，也可将步幅设置为2后对图像进行下采样，这种方式与最大池化类似。

边界扩充（Padding）：定义了网络层处理样本边界的方式。当卷积核大于1且不进行边界扩充，输出尺寸将相应缩小；当卷积核以标准方式进行边界扩充，则输出数据的空间尺寸将与输入相等。

输入与输出通道（Channels）：构建卷积层时需定义输入通道I，并由此确定输出通道O。这样，可算出每个网络层的参数量为I×O×K，其中K为卷积核的参数个数。例，某个网络层有64个大小为3×3的卷积核，则对应K值为 3×3 =9。

偏差（bias）：如果True，则向输出添加可学习的偏差。默认：True。

扩张操作（dilation）：控制kernel点（卷积核点）的间距，默认值:1。

（groups）：group参数的作用是控制分组卷积，默认不分组，为1组。

空洞卷积（atrous convolutions）又名扩张卷积（dilated convolutions），向卷积层引入了一个称为 “扩张率(dilation rate)”的新参数，该参数定义了卷积核处理数据时各值的间距。

关注

专栏目录