当您想要冻结部分模型时,或者您事先知道不会使用某些参数的梯度。
例如,如果要对预先训练的CNN进行优化,只要切换冻结模型中的requires_grad
标志就足够了,
直到计算到最后一层才会保存中间缓冲区,其中的仿射变换(卷级操作等)将使用需要梯度的权重并且网络的输出也将需要它们。
import torchvision import torch.nn as nn from torch import optim model = torchvision.models.resnet18(pretrained=True) for param in model.parameters(): param.requires_grad=False model.fc = nn.Linear(512,100) optimizer = optim.SGD(model.fc.parameters(), lr=1e-2, momentum=0.9)
这里将最后一层替换成了 model.fc = nn.Linear(512,100)原先是renet18中是,nn.Linear(512,1000)