一、模型的构建
base -- 基类,允许不同input channel 和不同的output channel 不同的backbone,通过参数传入。
1、backbone--resnet101
建构resnet:
input channel 6
替换first conv layer 因为 input channel = 6
删除原来的fully-connected layer
注:
Variant : 特殊的数据类型,除了固定长度string数据以外的任何类型的数据。
2、ASPP
来自于deeplabv3
金字塔池化,增加了空间的感受野
input channel = 2048
output channel = 256
ASPPConv 继承了 nn.Sequential, supper 先找到ASPPConv的父类 nn.Sequential,然后用父类的初始化方法来对ASPPConv的属性进行初始化。Sequential 是一个容器,将模块依次传入容器中。
torch.cat(x,dim) 将不同空洞卷积的结果连接起来。
3、decoder
output channel 1 + 3 + 1 + 32=37
各层输出通道的维数逐渐减少。512 -->256 -->64--> 6
有skilp connection
4、Refiner
有来自原始图像的skilp connection