卷积运算

最新推荐文章于 2024-05-29 11:25:24 发布

Ming Xu

最新推荐文章于 2024-05-29 11:25:24 发布

阅读量4.9k

点赞数 5

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43862398/article/details/104131163

版权

深度学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

卷积层

卷积的本质是用卷积核的参数来提取数据的特征，通过矩阵点乘运算与求和运算来得到结果。

下面给出一个基本的二维卷积的运算过程，即 $\omega x + b$

在这里插入图片描述

特征图 ( $x$ ) 的大小为 1 x 5 x 5, 输入的通道数为 1.
卷积核 ( $\omega$ ) 大小为 3 x 3
偏置（ $b$ ）为 1
为了保证输入的维度和输出的维度一致，还需要填充 (padding) 这里使用的 zeros-padding, 即用 0 来填充

使用 Pytorch 实现卷积计算

import torch
import torch.nn as nn

conv = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=3, stride=1, padding=1, dilation=1, groups=1, bias=True)

Conv2d() 的参数介绍

in_channels: 输入特征图的通道数，如何是 RGB 图像, 则通道数为 3. 卷积中的特征图通道数一般是 2 的整数次幂.
out_channels: 输出特征图的通道数
kernel_size: 卷积核的尺寸，常见的有 1、3、5、7.
stride: 步长，即卷积核在特征图上滑动的步长，一般为 1. 如果大于 1，则输出特征图的尺寸会小于输入的特征图尺寸.
padding: 填充，常见有 0 填充，边缘填充等，Pytorch 默认零填充
dilation:空洞卷积，当大于 1 时可以增大感受野的同时保持特征图的尺寸, 默认为 1
groups:可实现组卷积，即在卷积操作时不是逐点卷积，而是将输入通达分为多个组，稀疏连接达到降低计算量的目的.
bias: 是否需要偏置, 默认 True

总结:

输入数据体的尺寸是　 $W_1 \times H_1 \times D_1$
4 个超参数: 滤波器的数量 K，滤波器空间尺寸 F，滑动步长 S，零填充的数量 P.
输出数据体的尺寸是　 $W_2 \times H_2 \times D_2$ ，其中
$W_2 = \frac{W_1 - F + 2P}{S}，H_2 = \frac{H_1-F+2P}{S} + 1, D_2 = K$
由于参数共享，每个滤波器包含的权重数目为 $\times F \times D_1$ ，卷积层一共有 $\times F \times D_1 \times K$ 个权重和 $K$ 个偏置.
在输出的数据中第 $d$ 个深度切片 (空间尺寸是 $W_2 \times H_2$ ) 用第 $d$ 个滤波器和输入数据进行有效卷积运算的解雇再加上 $d$ 个偏置.

关注

5
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
卷积运算

卷积层卷积的本质是用卷积核的参数来提取数据的特征，通过矩阵点乘运算与求和运算来得到结果。下面给出一个基本的二维卷积的运算过程，即 y=ωx+by = \omega x + by=ωx+b特征图 (xxx) 的大小为 1 x 5 x 5, 输入的通道数为 1.卷积核 (ω\omegaω) 大小为 3 x 3偏置（bbb）为 1为了保证输入的维度和输出的维度一致，还需要填充 (padd...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。