因为 nn.Sequential()
中默认情况下,前一个层的输出形状必须和后一个层的输入形状一致。而假设有时根据实际情况需要将输入输出并不匹配的层包装起来,就是前一层的输出的维度与后一层的输入所要求的维度不匹配,这是就会报错例如下面代码
self.shortcut = nn.Sequential(
P4MConvP4M(in_planes, self.expansion*planes, kernel_size=1, stride=stride,
bias=True),
nn.BatchNorm2d(self.expansion*planes)
)
里面共有两层:第一层 P4MConvP4M
的输出是 5 维的,而而第二层nn. BatchNorm2d
只接受 4 维的输入。因此,在将这两个层连接起来运行时会报错:ValueError: expected 4D input (got 5D input
要解决这个问题,可以在 nn.Sequential()
中间添加一个函数来处理前一层的输出形状,将其转换为 4 维,再传递给 BatchNorm2d
。因为在sequential这个包装里无法使用变量自带的属性函数如 .reshape,但我们的目的就是要改变这个层的输出形状,没有自带函数,我们可以自己组建一个类实现。例如,可以添加一个 Reshape
类,它会将 5 维的输出形状转换为 4 维,针对上面问题代码示例如下:
class Reshape(nn.Module):
def __init__(self):
super(Reshape, self).__init__()
def forward(self, x):
return x.view(x.size(0), x.size(1) * x.size(2), x.size(3), x.size(4))
然后在nn.sequential()里的两层之间引用这个类就好了
self.shortcut = nn.Sequential(
P4MConvP4M(in_planes, self.expansion*planes, kernel_size=1, stride=stride,
bias=True),
Reshape(),
nn.BatchNorm2d(self.expansion*planes)
)