多通道图片卷积计算

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接: https://blog.csdn.net/yudiemiaomiao/article/details/72466402

对于单通道图像,若利用10个卷积核进行卷积计算,可以得到10个特征图;若输入为多通道图像,则输出特征图的个数依然是卷积核的个数(10个)。
1.单通道多个卷积核卷积计算


一个卷积核得到的特征提取是不充分的,我们可以添加多个卷积核,比如32个卷积核,从而可以学习32种特征。

2.多通道多个卷积核卷积计算
图片:假设图片的宽度为width:W,高度为height:H,图片的通道数为D,一般目前都用RGB三通道D=3,为了通用性,通道数用D表示;
卷积核:卷积核大小为K*K,由于处理的图片是D通道的,因此卷积核其实也就是K*K*D大小的,因此,对于RGB三通道图像,在指定kernel_size的前提下,真正的卷积核大小是kernel_size*kernel_size*3。
对于D通道图像的各通道而言,是在每个通道上分别执行二维卷积,然后将D个通道加起来,得到该位置的二维卷积输出,对于RGB三通道图像而言,就是在R,G,B三个通道上分别使用对应的每个通道上的kernel_size*kernel_size大小的核去卷积每个通道上的W*H的图像,然后将三个通道卷积得到的输出相加,得到二维卷积输出结果。因此,若有M个卷积核,可得到M个二维卷积输出结果,在有padding的情况下,能保持输出图片大小和原来的一样,因此是output(W,H,M)。

下面的图动态形象地展示了三通道图像卷积层的计算过程:

### 多通道卷积核的卷积操作原理 #### 卷积核与特征映射的关系 在深度学习中的卷积神经网络(CNN),当存在多个卷积核时,能够学习到不同类型的特征。每一个卷积核作为一个独立的学习单元,会生成一个对应的特征图(channel)[^1]。 对于一个多通道输入的情况(比如RGB彩色图片),每个卷积核实际上是一个三维结构,其宽度和高度匹配输入图像的空间维度,而第三个维度则等于输入channel的数量。这意味着单个卷积核会在所有输入channels上滑动并执行逐元素乘法求和的操作来计算响应值。因此,即使面对具有三个颜色分量(RGB)的数据集,也能有效地应用这种机制来进行特征检测[^3]。 #### 输出Feature Map的形成 假设有一个输入张量尺寸为\(H \times W \times C_{in}\)(高×宽×输入通道数), 使用了N个大小相同、形状为\(K_h × K_w × C_{in}\) (内核的高度×宽度×输入通道数目) 的卷积滤波器(filter/convolution kernel). 那么经过一次完整的二维空间上的扫描之后将会得到一个新的四维输出张量 \(H' \times W' \times N\) ,其中\(H'\) 和 \(W'\) 是通过考虑填充(padding) 及步幅(stride) 后调整过的新的高度和宽度;最后一个维度即代表了由这些不同卷积核所形成的feature maps数量——也就是最终output channels 数目. #### 特征表达能力提升 随着卷积层数加深以及更多卷积核的应用,CNN可以从原始像素级信息逐步抽象出更加复杂且语义丰富的高层特性描述子(high-level feature descriptors) 。例如,在早期阶段可能主要识别简单的局部图案(如边界线条); 而到了后期,则倾向于捕捉更为综合的对象组成部分乃至整体形态轮廓等全局属性[^2]. 更多的通道允许网络同时处理更多信息流,从而增强了对多样化视觉特性的感知力,有助于提高分类准确性和其他任务性能表现. ```python import torch.nn as nn class ConvLayer(nn.Module): def __init__(self, in_channels=3, out_channels=64, kernel_size=(5, 5)): super(ConvLayer, self).__init__() self.conv = nn.Conv2d(in_channels=in_channels, out_channels=out_channels, kernel_size=kernel_size) def forward(self, x): return self.conv(x) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值