torchvision 模型中包含了许多预训练模型,如:resnet, alexnet, vgg, squeezenet, densenet, inception,所有这些模型都已经预先在1000类的magenet数据集上训练完成。
在特征提取中,我们从预训练模型开始,只更新产生预测的最后一层的权重。它被称为特征提取是因为我们使用预训练的CNN作为固定的特征提取器,并且仅改变输出层。
当我们进行特征提取时,此辅助函数将模型中参数的 .requires_grad
属性设置为False,即不改变参数的变化。
for param in model.parameters():
param.requires_grad = False
CNN模型的最后一层(通常是FC层)与数据集中的输出类的数量具有相同的节点数。 由于所有模型都已在Imagenet上预先训练,因此它们都具有大小为1000的输出层,每个类一个节点。所以我们需要保持输入不变,改变其输出值,使输出为想要分类的数目。
当进行特征提取时,我们只想更新我们正在重塑层的参数。 因此,我们将其它层的.requires_grad属性设置为False。 这很重要,因为默认情况下,此属性设置为True。 然后,当我们初始化新层时,默认情况下新参数.requires_grad = Tru