网络骨架 backbone
物体检测算法流程:
- 利用卷积神经网络处理输入图像
- 生成特征图
- 利用算法完成区域生成和损失计算
卷积层
提取图像特征
torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding, dilation, groups, bias)
- in_channels:输入特征图的通道数,一般处理RGB图像时为3
- out_channels:输出特征图的通道数
- kernel_size:卷积核的尺寸,常见的有1,3,5,7的正方形
- stride:卷积核计算滑动步长,一般为1,若大于1,则输出特征图的尺寸会变小
- padding:填充,常见的有零填充,边缘填充,默认为零填充
- dilation:空洞卷积,大于1可以在保证特征图尺寸的同时增大感受野,默认为1
- groups:可实现组卷积,达到降低计算量的目的
- bias:是否需要偏置,默认为True </