yolo v3的网络结构(二)
还是先上在学习Yolo时不是很清楚的点。
Conv2d
有Conv1d和Conv2d。前者是一维的卷积,能处理多维数据;后者是二维卷积,可以处理二维数据。
以Conv2d为例,用代码表示:
nn.Conv2d(self, in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True))
参数:
in_channel: 输入数据的通道数,例RGB图片通道数为3;
out_channel: 输出数据的通道数,这个根据模型调整;
kennel_size: 卷积核大小,可以是int,或tuple;kennel_size=2,意味着卷积大小(2,2), kennel_size=(2,3),意味着卷积大小(2,3)即非正方形卷积;
stride:步长,默认为1,与kennel_size类似,stride=2,意味着步长上下左右扫描皆为2, stride=(2,3),左右扫描步长为2,上下为3;
padding: 零填充。
例子:当输入数据X[10,16,30,32],其分别代表:10组数据,通道数为16,高度为30,宽为32时。