AlexNet2012年时计算机的算力还不足以支持这么深层的模型,所以AlexNet当时是把模型并行放在两个GPU上,而这篇文章是合并计算的。值得注意的是,AlexNet模型中输入图像是224×224×3。
AlexNet模型
先看模型代码:
net = nn.Sequential(
nn.Conv2d(3, 96, kernel_size=11, stride=4, padding=2), nn.ReLU(),
nn.MaxPool2d(kernel_size=3, stride=2),
nn.Conv2d(96, 256, kernel_size=5, stride=1, padding=2), nn.ReLU(),
nn.MaxPool2d(kernel_size=3, stride=2),
nn.Conv2d(256, 384, kernel_size=3, stride=1, padding=1), nn.ReLU(),
nn.Conv2d(384, 384, kernel_size=3, stride=1, padding=1), nn.ReLU(),
nn.C