在cv领域,卷积神经网络已经是每个cv人必会的网络结构之一,今天就基于Pytorch框架中的Conv2d()来讲讲卷积操作。
在pytoch中,Tensor的维度是[batch_size,channel,Height,Width] 即 [B,C,H,W]。查阅Pytoch的官方文档,Conv2d的参数有:
我们只关心前3个参数。
(1)in_channels是输入张量的通道数,下图中的in_channels=3,
(2)out_channels是输出张量的通道数,这个参数实际上指的是据卷积核的个数,即最后输出的张量的通道数。
(3)kernel_sizes是卷积核的尺寸,因为卷积核的维度必须和你输入张量的维度一致,故这里只需要输入你想要的卷积核的尺寸即可。卷积核的初始值可以自己定义,如果没有自己定义,Pytorch也会自动随机初始化。
(4)至于stride和padding这里就不细讲了。
这里我们的输入是(1,3,3,3),卷积核是(2,3,2,2) 得到输出是(1,2,2,2)
用代码实现一下
import torch
from torch import nn
input = torch.ones(1,3,3,3)
class Conv(nn.Module):
def __init__(self):
super(Conv, self).__init__()
self.conv = torch.nn.Conv2d(3,2,kernel_size=2,padding=0,stride=1)
def forward(self,x):
output = self.conv(x)
return output
def weight_init(m):
if isinstance(m, nn.Conv2d):
nn.init.constant_(m.weight,2)
nn.init.constant_(m.bias, 0)
net = Conv()
net.apply(weight_init)
output = net(input)
print(output)
print(output.size())
输出为,与图中一致。