parameters.requires_grad=False ：误差仍然反向传播，梯度不更新

Stig_Q

已于 2022-09-26 17:12:56 修改

阅读量2.7k

点赞数 5

分类专栏：机器学习 ML

于 2022-09-26 16:58:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37006625/article/details/127056694

版权

机器学习 ML 专栏收录该内容

19 篇文章 8 订阅

订阅专栏

首先要明白，误差回传与否，与 requires_grad 的值没有关系，取决于 loss.backward( ) 。

再来看误差回传过程中规定是，parameters的梯度计算关闭。

param.requires_grad = False

我们要知道，param 包括的无非是权重和 偏置值。

而权重和偏置值的偏导值是多少并不影响误差反向传播，误差反向传播主干部分计算的是每一层激活前神经元的偏导值。

综上：

param.requires_grad = False 不影响误差反向传播的正常进行，但是权重和偏置值不更新了。

用法：冻结参数，不参与反向传播，具体实现是将要冻结的参数的requires_grad属性置为false，然后在优化器初始化时将参数组进行筛选，只加入requires_grad为True的参数

cnn = CNN() #构建网络
 
for n,p in cnn.named_parameters():
    print(n,p.requires_grad)
    if n=="conv1.0.weight":
        p.requires_grad = False
 
optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad,cnn.parameters()), lr=learning_rate)

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
parameters.requires_grad=False ：误差仍然反向传播，梯度不更新

parameters.requires_grad=False ：误差仍然反向传播，梯度不更新
复制链接

扫一扫

专栏目录

Stig_Q CSDN认证博客专家 CSDN认证企业博客

码龄8年

105: 原创

3万+: 周排名

8936: 总排名

106万+: 访问

: 等级

3351: 积分

235: 粉丝

671: 获赞

66: 评论

2650: 收藏

私信

关注

热门文章

分类专栏

最新评论

keil5 #include“头文件”前面有红叉X，但编译不报错
Eric.110: 你这治标不治本
【STM32】系统时钟RCC详解(超详细，超全面)
Stig_Q: 我的理解是时钟源是同时存在的，同时工作的，选择某个时钟源经过分频或倍频作为系统时钟，系统时钟再分频出不同的总线时钟供外设使用。
【STM32】系统时钟RCC详解(超详细，超全面)
Blue_o-o: 博主请问一下：就是左边的四个时钟源，同一时间只能存在一个对吧，只能选择其中的一个时钟源提供单片机需要的系统时钟，还是说四个时钟源都可以同时工作，然后系统时钟可以随意切换哪一个工作中的时钟源作为时钟源输入
Maven是什么？ Maven的概念+作用+仓库的介绍+常用命令
2401_83643098: 很好理解
残差、方差、偏差、MSE均方误差、Bagging、Boosting、过拟合欠拟合和交叉验证
weixin_67658111: 1.3偏差的第一段第一句是不是有点问题：Bias反映的是模型在样本上的输出和真实值之间的误差。偏差应该是期望输出和真实值之间的差别吧

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Stig_Q 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。