Pytorch 可微分round函数

Salmon_lee

已于 2022-04-07 11:59:05 修改

阅读量4.3k

点赞数 9

分类专栏：科学炼丹文章标签： pytorch 深度学习

于 2022-01-26 18:45:26 首次发布

本文链接：https://blog.csdn.net/leelitian3/article/details/122706994

版权

科学炼丹专栏收录该内容

14 篇文章

订阅专栏

round函数在定义域中的导数，处处为0或者无穷，梯度无法反向传播。本文将使用autograd.function类自定义可微分的round函数，使得round前后的tensor，具有相同的梯度。

from torch.autograd import Function


class BypassRound(Function):
  @staticmethod
  def forward(ctx, inputs):
    return torch.round(inputs)

  @staticmethod
  def backward(ctx, grad_output):
    # 这里的grad_output是round之后的tensor的梯度，直接将它作为round之前tensor的梯度
    return grad_output


# Function.apply的别名
bypass_round = BypassRound.apply

# demo
z3_rounded = bypass_round(z3)

具体原理和细节参考以下博客：

定义torch.autograd.Function的子类，自己定义某些操作，且定义反向求导函数_tsq292978891的博客-CSDN博客_saved_tensors

2022.4.7更新：更简单的方法如下

def ste_round(x):
    return torch.round(x) - x.detach() + x

torch.round(x)导数处处为0，x.detach()在计算图中，x的导数为1

因此：ste_round(x)的梯度 == x的梯度

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Salmon_lee

关注关注

9
点赞
踩
13

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

PyTorch深度学习实战（2）——PyTorch基础

盼小辉丶的博客

06-04

5万+

PyTorch 是广泛应用于机器学习领域中的强大开源框架，因其易用性和高效性备受青睐。在本节中，将介绍使用 PyTorch 构建神经网络的基础知识。首先了解 PyTorch 的核心数据类型——张量对象。然后，我们将深入研究用于张量对象的各种操作。PyTorch 提供了许多帮助构建神经网络的高级方法及组件，并提供了利用 GPU 更快地训练神经网络的张量对象。

【小白深度教程 1.18】手把手教你使用 Pytorch3D（3）使用可微分体积渲染拟合 Volume

2401_87064292的博客

09-11

561

本教程展示了如何使用可微分体积渲染，根据场景的一组视图来拟合体积（Volume）。更具体地说，本教程将解释如何： - 创建一个可微分体积渲染器。 - 创建一个体积模型（包括如何使用 Volumes 类）。 - 使用可微分体积渲染器基于图像拟合体积。 - 可视化预测的体积。

3 条评论您还未登录，请先登录后发表或查看评论

pytorch:tensor的运算

meijie2018_1的博客

10-22

2631

** 一、加减乘除 ** torch.add / torch.sub / torch.mul / torch.div 分别为矩阵对应元素的加减乘除与使用符号±*/功能相同 //表示整除 In [1]: import torch In [2]: a = torch.rand(3,4) In [3]: b = torch.rand(4) In [4]: a+b Out[4]: tensor([...

pytorch中的 torch.round()函数

热门推荐

m0_46483236的博客

03-19

1万+

函数详解： torch.round(input, out=None) 说明：返回一个新张量，将输入input张量的每个元素舍入到最近的整数。参数： input（Tensor）：输入张量 out（Tensor，可选）：输出张量 import torch a = torch.randn(4) print(a) ## tensor([-0.8229, -0.6338, -1.3387, -0.0584]) print(torch.round(a)) ## tens

torch.round()

持之以恒

10-27

4564

>>> a = torch.randn(4) >>> a tensor([ 0.9920, 0.6077, 0.9734, -1.0362]) >>> torch.round(a) tensor([ 1., 1., 1., -1.])

Pytorch函数

weixin_43244470的博客

03-29

394

***1、Variable：***一种存放tensor变量的方式，pytorch中tensor只能放在CPU上运算，而(variable)变量是可以只用GPU进行加速计算的。 from torch.autograd import Variable x = Variable(tensor, requires_grad = True) Varibale包含三个属性：data：存储了Tensor，是本...

【深度学习】与【PyTorch实战】

小李很执着的博客

05-21

2474

神经网络模仿生物神经系统，由许多互联的神经元（人工神经元）组成。输入层：接收外部输入数据，每个神经元代表一个输入特征。隐藏层：位于输入层和输出层之间，负责提取和处理输入特征，数量和结构可以多样化。输出层：产生最终的输出，每个神经元代表一个输出结果。神经网络通过调整各层之间的连接权重，学习数据中的模式和特征。动态计算图：支持即时计算，便于调试和修改模型结构。强大的自动微分：通过autograd模块实现自动求导，简化了梯度计算过程。模块化设计：提供丰富的预定义模块和函数，方便构建和训练复杂的神经网络。

【pytorch】使用pytorch构建线性回归模型-了解计算图和自动梯度

weixin_45568812的博客

01-11

1458

小批量随机梯度下降（Mini-batch Stochastic Gradient Descent）是批量梯度下降的一种变体。与批量梯度下降相比，小批量随机梯度下降在每次迭代时只使用一小部分数据（称为小批量）来计算梯度，然后根据这个梯度来更新模型的参数。Jθ1m∑i1mLyifθxiJθm1i1∑mLyifθxi))其中，JθJ(\theta)Jθ是目标函数，mmm是数据集的大小，LyifθxiLyi。

深度学习开发入门（三）——PyTorch深度学习基础

2202_75671186的博客

03-24

1018

Tensor对象是一个任意维度的矩阵，但是Tensor中所有元素的数据类型必须一致。torch包含的数据类型和普遍编程语言的数据类型类似，包含浮点型、有符号整型和无符号整型。这些类型既可以定义在CPU上，也可以定义在GPU上。在使用Tensor数据类型时，可以通过dtype属性指定它的数据类型，device指定它的设备（CPU或者GPU）。通过device在GPU上定义变量后，可以在终端上通过nvidia-smi命令查看显存占用。torch还支持在CPU和GPU之间复制变量。

’torch.round后梯度为0，无法进行梯度回传‘的解决方法

Paul_Huang的专栏

05-30

1907

问题描述：round函数在定义域中的导数，处处为0或者无穷，梯度无法反向传播。本文将使用autograd.function类自定义可微分的round函数，使得round前后的tensor，具有相同的梯度。torch.round(x)导数处处为0，x.detach()在计算图中无梯度，因此其ste_round的倒数就是x的导数。torch.round(x)导数处处为0，x.detach()在计算图中，x的导数为1。

关于torch.round可导性问题

qq_39861441的博客

08-05

1497

先上结论：不可导 import torch import torch import torch.nn as nn class g(nn.Module): def __init__(self): super(g, self).__init__() # self.k = nn.Conv2d(in_channels=2, out_channels=1, kernel_size=1, padding=0, bias=False) def forward(s

pytorch教程(1.5)——梯度自动计算

leetteel

09-14

1304

摘要在训练神经网络时，最常用的算法是反向传播。在该算法中，参数（模型权重）根据损失函数相对于给定参数的梯度进行调整。为了计算这些梯度，PyTorch 有一个名为 torch.autograd 的内置微分引擎。它支持任何计算图的梯度自动计算。考虑最简单的一层神经网络，输入 x，参数 w 和 b，以及一些损失函数。它可以通过以下方式在 PyTorch 中定义： import torch x = torch.ones(5) # input tensor y = torch.zeros(3) #

PyTorch深度学习

Ting_28的博客

03-14

1688

Tensor对象是一个任意维度的矩阵，但是一个Tensor中所有元素的数据类型必须一致。Torch包含的数据类型和普遍的编程语言的数据类型相似，包含浮点型、有符号整型和无符号整型。这些类型既可以定义在CPU上，也可以定义在GPU上。

pytorch基础知识八【基本数学运算】

weixin_43188487的博客

12-11

1958

基本数学运算1. 加减乘除2. 矩阵乘法3. 开方4. 近似运算 1. 加减乘除 a = torch.tensor([[1,2,3],[4,5,6],[7,8,9]]) print(a) b = torch.tensor([[10,20,30],[40,50,60],[70,80,90]]) # 加法 print(a+b) print(torch.add(a,b)) # 减法 print(torch.all(torch.eq(a-b,torch.sub(a,b)))) # 乘法 print(torch.

PytorchZerotoAll学习笔记（二）--梯度下降之手动求导

weixin_30474613的博客

01-15

359

梯度下降算法：　　待优化的损失值为 loss，那么我们希望预测的值能够很接近真实的值 y_pred≈ y_label 我们的样本有n个，那么损失值可以由一下公式计算得出：要使得loss的值尽可能的小，才会让预测的值接近于标签值： ...

深度学习Pytorch-Tensor的属性、算术运算

最新发布

算法工程师

10-23

1049

深度学习Pytorch-Tensor的属性、算术运算

pytorch梯度下降函数_pytorch入门2：梯度下降算法

weixin_39681486的博客

12-21

118

原理：通过梯度下降算法，求解loss的最小值，设置好初始w权重值，不断进行迭代，最后得到最小的loss值代码：# Training Datax_data = [1.0, 2.0, 3.0]y_data = [2.0, 4.0, 6.0]w = 1.0 # a random guess: random value# our model forward passdef forward(x):retur...

pytorch学习笔记5--pytorch基本运算

code_fighter 博客

06-12

6554

文章目录基本运算add/minus/multiply/dividematmul基本函数统计属性normmean,sum,min,max,prod,argmin,argmaxkthvalue,topk\>,>=,<,<=,!=,==高阶操作(GPU)whereGather梯度lossMean Squared Error(MSE)：自动求导：torch.autograd.gra...

pytorch 新式自动微分函数

05-16

在PyTorch中，新式自动微分函数是指通过torch.autograd.Function来实现的自定义函数。与旧式自动微分函数相比，新式自动微分函数具有更高的灵活性和可扩展性。下面是一个简单的示例： ```python import torch class MyReLU(torch.autograd.Function): @staticmethod def forward(ctx, input): ctx.save_for_backward(input) return input.clamp(min=0) @staticmethod def backward(ctx, grad_output): input, = ctx.saved_tensors grad_input = grad_output.clone() grad_input[input < 0] = 0 return grad_input # 使用自定义的ReLU函数 x = torch.randn(10, 10, requires_grad=True) y = MyReLU.apply(x) y.mean().backward() ``` 在该示例中，我们定义了一个新式自动微分函数MyReLU，并使用它来计算输入张量x的ReLU值。在forward方法中，我们将输入张量保存到上下文中，以便在backward方法中使用。在backward方法中，我们计算并返回输入张量的梯度。需要注意的是，我们必须手动实现梯度计算，而不是依赖于PyTorch的自动微分机制。值得一提的是，PyTorch还提供了一种更简单的自定义函数方式，即使用torch.nn.Module来定义自定义层。这种方式是基于新式自动微分函数实现的，但是封装了更多的功能，比如参数管理和模型保存等。