(1)作者没有给训练代码和
从上图种可以看到,红色的是图片的过程,蓝色的是主要的模块。
(2)
可以看到,四个主要的模块如图所示。
他的参数都是写死的,看来比较好读。、
第一个,主要就是特征提取器,好像没看出特别的部分。
如果输入是(2,3,512,512)的,那么他的输出是(2,64,512,512)的,也就是只改变了通道数,其他的分辨率啥的都没变。
(3)然后接下来,让我们看看下一个模块。
经过这个detectionbranch模块,输出变成了2,1,512,512维度的,这只改变了通道的数量,没改变其他的数量。让我们继续看看这个是在干嘛。
(4)
然后下一步,一个x是(2,1,512,512)维度的,一个graph是(2,256,2)维度的。
(5)
在预测的时候,需要用的,1.原始的图片。2.model提取的特征。3.压缩的graph。graph的维度是(2,256,2)维度的图。