李沐动手学深度学习:自动求导

最新推荐文章于 2024-04-20 15:46:15 发布

carrotfantacy123

最新推荐文章于 2024-04-20 15:46:15 发布

阅读量592

点赞数

文章标签：深度学习

本文链接：https://blog.csdn.net/qq_44078329/article/details/120606577

版权

import torch
#假设对y=2XΤX(转置) 关于列向量x求导
x=torch.arange(4.0)
#在计算之前需要一个地方存储梯度
x.requires_grad_(True) #等价于 x=torch.arange(4.0,requires_grad=True)
x.grad

#计算y
y=2*torch.dot(x,x)
y

#通过调用反向梯度函数计算y关于x每个分量的梯度
y.backward()
x.grad

#验证
x.grad==4*x

#计算x的另一个函数
x.grad.zero_() #梯度清零
y=x.sum()
y.backward()
x.grad

#深度学习中我们的目的并不是计算微分矩阵而是批量中每个样本单独计算偏导之和
#大部分是对标量求导
x.grad.zero_()
y=x*x
#等价于y.backward(torch.ones(len(x)))
y.sum().backward()
x.grad

#将某些计算移动到计算图之外
x.grad.zero_()
y=x*x
u=y.detach() #u:把y当作常数
z=u*x

z.sum().backward()
x.grad==u

#当使用复杂的Python计算控制流仍然可以求导
def f(a):
b=a*2
while b.norm()<1000:
b = b*2
if b.sum()>0:
c = b
else:
c = 100*b
return c

a = torch.randn(size=(),requires_grad=True)
d = f(a)
d.backward()

a.grad==d/a

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

carrotfantacy123

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

1.动手学习深度学习课程安排及深度学习数学基础

kaszxc的博客

06-13

144

首先，我们导入torch，注意，虽然它被称为pytorch，但我们应该导入torch而不是pytorch。矩阵相当于一个扭曲空间，把下图中的蓝线和绿线，扭曲到不同方向和长度。

torch.randn()用法

ranrankeai的博客

11-14

1033

【代码】torch.randn()用法。

参与评论您还未登录，请先登录后发表或查看评论

动手学深度学习Day03

南邮在读本科生的博客

01-20

245

动手学深度学习Day03

学习笔记：动手学深度学习 06 自动求导

weixin_43137437的博客

11-02

1058

1. example 创建变量x并为其分配一个初始值。 import torch x = torch.arange(4.0) x 在计算y关于x的梯度之前，我们需要一个地方来存储梯度。 x.requires_grad_(True) # 等价于 `x = torch.arange(4.0, requires_grad=True)` x.grad # 默认值是None y = 2 * torch.dot(x, x) y x是一个长度为4的向量，计算x和x的内积，得到了我们赋值给y的标

动手学深度学习——自动求导

m0_64695874的博客

10-31

111

答：这是因为y=x*x,此时y是一个矩阵，而在深度学习中，通常用标量对向量求梯度，而不是用矩阵对向量求梯度，所以接着使用y.sum()让y的每个元素求和，结果为一个标量，然后使用backward(),让y对x求梯度，即：对x的每一个元素求偏导数。这两种情况下，对于任何a，存在某个常量标量k，使得f(a)=k*a，其中k的值取决于输入a。4、为什么f(a)是相当于k*a，其中k是f(a)的梯度？这部分是分段的，因为输出取决于条件。作为常数处理，求导结果是u，而不是。因此，整体而言，我们可以近似说，在。

深度学习与神经网络学习笔记(三)---自动求导

GodWeiJia的博客

08-07

369

关于深度学习与神经网络的一些学习笔记

李沐-动手学深度学习-自动求导

qq_60678226的博客

05-23

415

假设我们想对函数y = 2xTx，关于列向量x求导。并对x赋予初值。在我们计算y 关于x 的梯度之前，我们需要一个地方来存储梯度。重要的是，我们不会在每次对一个参数求导时都分配新的内存。因为我们经常会成千上万次地更新相同的参数，每次都分配新的内存可能很快就会将内存耗尽。我们通过调用反向传播函数来自动计算y关于x每个分量的梯度，并打印这些梯度。默认情况下，会累积梯度，所以在求另一个函数的梯度时要进行清零操作。当将清零代码进行注释时，梯度会累加：当y不是标...

最全面的 深度学习 笔记【土堆 Pytorch】【李沐动手学深度学习】【吴恩达 深度学习】

05-16

深度学习是机器学习的一个重要分支，通过模拟人脑的神经网络结构进行数据处理和模式识别。以下是三种重要的深度学习资源，它们涵盖了...李沐的《动手学深度学习》是一本非常适合初学者的教材，结合理论与实践，采用J

李沐-动手学深度学习-感知机及激活函数的介绍

qq_60678226的博客

05-31

1262

线性模型的不足：任何特征的增大都会导致模型输出的增大（如果对应的权重为正），或者导致模型输出的减小（如果对应的权重为负）。似然函数：似然函数是一种关于统计模型参数的函数。而p(x|θ)也是一个有着两个变量的函数。如果，你将θ设为常量，则你会得到一个概率函数（关于x的函数）；如果，你将x设为常量你将得到似然函数（关于θ的函数）。下面举一个例子：有一个硬币，它有θ的概率会正面向上，有1-θ的概率反面向上。θ是存在的，但是你不知道它是多少。为了获得θ的值，你做了一个实验：将硬币抛10次，得到了一个正

07自动求导.zip

最新发布

07-31

一个深度学习代码练习仓库,主要包含了李沐老师的动手学习深度学习课程的相关代码实现。主要功能点实现了从零开始的深度学习模型,如线性回归、Softmax 回归、多层感知机等。实现了经典的卷积神经网络模型,如 ...

pytorch中torch.randn(batch_size,channels,width,height)理解

nszzzzdr的博客

08-11

840

函数是PyTorch中用于生成服从（均值为0，方差为1）的随机数的函数1）用来创建指定大小的张量；2）张量中的元素是从标准正态分布中采样得到的随机数。参数说明：：表示生成的随机数张量的大小。可以是一个整数，表示生成一个具有指定大小的1维张量，也可以是一个整数元组，表示生成一个具有指定大小的多维张量。：可选参数，用于指定输出张量。：可选参数，用于指定输出张量的数据类型，默认为None，表示使用默认的数据类型。：可选参数，用于指定输出张量的布局，默认为torch.strided。

自动微分----pytorch中的梯度运算与反向传播函数(预备知识)

西小庄村高伟的博客

09-22

1807

torch中的自动微分，requires_grad梯度计算、backward()反向传播函数、detach()分离函数

07-自动求导实现动手深度学习

m0_50065739的博客

01-03

109

李沐动手深度学习07自动求导代码

深度卷积神经网络的整体运行流程（以alexnet为例）

qq_72985002的博客

04-20

726

即使是网络只有一个隐藏层，给定足够的神经元和正确的权重，我们可以对任意函数建模，尽管实际中学习该函数是很困难的。因此，下面的反向传播函数计算z=u*x关于x的偏导数，同时将u作为常数处理，（正向传播x>y,x>z，即z对x有两条传播途径，分别是y,2x*x，相加就是结果，现在把对y求导那条路断了，结果只有y了，也就是x^2，也就是u）y是作为x的函数计算的，而z则是作为y和x的函数计算的。我们想计算z关于x的梯度，但由于某种原因，希望将y视为一个常数，并且只考虑到x在y被计算后发挥的作用。

【动手学深度学习】 2预备知识

sumshine_的博客

09-12

1536

第二章的知识涉及数据操作、数据预处理、线性代数、微分、求导、随机过程。其中数据预处理比较重要，单独写一篇。知识点中要明确一个名词——张量，其他的是复习一些数学上的知识以及学习其代码实现的过程。

PyTorch-----torch.randn()函数详解

xinxin的博客

03-26

1230

requires_grad(可选):如果为True，则在反向传播期间将计算此张量的梯度。pin_memory(可选):如果为True，张量将被固定，从而使数据更快地传输到支持cuda的gpu。这将生成一个3x2张量，其中充满从标准正态分布中采样的随机数。dtype(可选):输出张量所需的数据类型。layout(可选):输出张量的内存布局。out(可选):输出张量。如果提供，结果将被写入这个张量，而不是创建一个新的张量。device(可选):分配张量的设备。size:指定输出张量维度的列表或元组。

Pytorch常用的函数(一)torch.squeeze()和torch.unsqueeze()、torch.cat()和torch.stack()函数功能及使用

qq_44665283的博客

06-05

4523

torch.squeeze()和torch.unsqueeze()、torch.cat()和torch.stack()函数功能及使用

简单lstm

c851666395的博客

10-27

200

lstm代码

深度学习笔记 —— 自动求导

LightInDarkness的博客

02-13

1637

显示构造：先定义好公式，再待入值。隐式构造：系统负责记住一步步的计算，之后定义公式。 import torch # 假设我们想对函数y = 2xTx关于列向量x求导 x = torch.arange(4.0) # 计算y关于x的梯度之前，需要一个地方来存储梯度 x.requires_grad_(True) # 等价于 x = torch.arange(4.0, require_grad=True) print(x.grad) ...

李沐《动手学习深度学习》

10-08

李沐是一位著名的深度学习专家，他是MXNet深度学习框架的创始人之一，并且担任着D2L（动手学习深度学习）这门开放在线教育课程的作者之一。《动手学习深度学习》（Dive into Deep Learning）是该课程的教材，它旨在...