首先要明白,误差回传与否,与 requires_grad 的值没有关系,取决于 loss.backward( ) 。
再来看误差回传过程中规定是,parameters的梯度计算关闭。
param.requires_grad = False
我们要知道,param 包括的无非是 权重 和 偏置值。
而权重和偏置值的偏导值是多少并不影响误差反向传播,误差反向传播主干部分计算的是每一层激活前神经元的偏导值。
综上:
param.requires_grad = False
不影响误差反向传播的正常进行,但是权重和偏置值不更新了。
用法:冻结参数,不参与反向传播,具体实现是将要冻结的参数的requires_grad属性置为false,然后在优化器初始化时将参数组进行筛选,只加入requires_grad为True的参数
cnn = CNN() #构建网络
for n,p in cnn.named_parameters():
print(n,p.requires_grad)
if n=="conv1.0.weight":
p.requires_grad = False
optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad,cnn.parameters()), lr=learning_rate)