本次训练用了SSD模型,代码为GitHub上lufficc那一版,backbone为mobilenetv1,自己试着修改的,很艰难。完了之后感觉对网络模型的理解又深了一层。在此简要叙述遇到的问题。
1.参考资料
pytorch 实现SSD详细理解 (一)vgg和特征图的提取
SSD原理及Pytorch代码解读——网络架构(二):特征提取网络及总体计算过程
2.索引值超出范围
错误:索引值14超出范围,检查后发现这个索引值是按照我定义的模块来算的,比如con_bn_relu算一层而不是三层,所以self.model总共14层,索引值为0~13.
3.查看网络结构
想看看自己写的网络结构究竟什么样,所以用了print(model)
4.查看特征图大小
出现错误,说是输入为2×2,但卷积核为3×3,输入比卷积核小,出现错误。于是按照下图方式输出每一层的x.size()
通过type(x)得知x为tensor类型(一个多维张量或者说多维矩阵),因此可以输出其维数来查看每层的feature map大小及输出输入通道数。
pytorch中如何查看Tensor的维度
通过上一步操作发现,是第一层的con_bn_relu的步长设成了3,导致第一层结束后特征图减小为1/3(从320到107),后续的大小都出错了。改掉后可以正常运行。
5.训练迭代次数
这个代码的设置为每250次迭代就验证一次,一开始我还以为训练就结束了(loss还很高),吓我一跳,结果验证完了继续训练,虚惊一场