tensor的运算问题记录——可变数据类型与不可变数据类型

腹有诗书，何患无辞

已于 2022-05-11 10:28:31 修改

阅读量1.4k

点赞数 1

分类专栏：深度学习文章标签： python 深度学习 pytorch

于 2022-02-10 18:39:22 首次发布

本文链接：https://blog.csdn.net/qq_46181653/article/details/122866271

版权

深度学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

文章目录

1.背景
2.代码
- 2.1代码解释
- 2.2原因
3.Python 可变/不可变类型表
4.其他解释

1.背景

在看pytorch代码的时候有一段代码(如下)，对其中的参数w,b值更新有些困惑,做此记录.

2.代码

def sgd(params, lr, batch_size):  #@save
    """小批量随机梯度下降"""
    with torch.no_grad():
        for param in params:
            param -= lr * param.grad / batch_size
            param.grad.zero_()

lr = 0.03
num_epochs = 10
net = linreg
loss = squared_loss

for epoch in range(num_epochs):
    for X, y in data_iter(batch_size, features, labels):
        l = loss(net(X, w, b), y)  # X和y的小批量损失
        # 因为l形状是(batch_size,1)，而不是一个标量。l中的所有元素被加到一起，
        # 并以此计算关于[w,b]的梯度
        l.sum().backward()
        sgd([w, b], lr, batch_size)  # 使用参数的梯度更新参数
    with torch.no_grad():#torch.no_grad指定计算不会在反向传播中被记录
        train_l = loss(net(features, w, b), labels)
        print(f'epoch {epoch + 1}, loss {float(train_l.mean()):f}')

2.1代码解释

迭代10次，每次取batch_size大小的数据进行如下操作:
1.将数据带入线性回归函数求loss
2.求loss的梯度
3.随机梯度下降方法，更新参数

sgd为优化函数
data_iter为随机下批量采样函数，返回值为指定批量的features和labels数据
net为线性回归函数

在sgd函数中,参数的更新方式用的是param -= lr * param.grad / batch_size,sgd函数的param的改变会影响到外部参数w,b的变化，为什么呢?

2.2原因

不可变数据类型的值更改后其地址发生改变，可变数据类型的值更改其地址不发生改变。

tensor为可变数据类型,即sgd函数内部的同数据类型的赋值，会改变函数外部对应参数的值.
示例如下:

3.Python 可变/不可变类型表

在这里插入图片描述

4.其他解释

https://discuss.d2l.ai/t/topic/1778/7?u=ilearn-better

腹有诗书，何患无辞

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
1
评论
tensor的运算问题记录——可变数据类型与不可变数据类型

文章目录背景代码代码解释原因Python 可变/不可变类型表背景在看pytorch代码的时候有一段代码(如下)，对其中的参数w,b值更新有些困惑,做此记录.代码def sgd(params, lr, batch_size): #@save """小批量随机梯度下降""" with torch.no_grad(): for param in params: param -= lr * param.grad / batch_size
复制链接

扫一扫