mxnet中自动求梯度

最新推荐文章于 2024-04-20 12:17:45 发布

comli_cn

最新推荐文章于 2024-04-20 12:17:45 发布

阅读量906

点赞数 2

分类专栏：深度学习相关

本文链接：https://blog.csdn.net/comli_cn/article/details/102615238

版权

深度学习相关专栏收录该内容

12 篇文章 5 订阅

订阅专栏

我用的是mxnet包里面的自动求梯度的模块autograd。
一、在autograd下求梯度一般要进行一下几个步骤：
1、调用attach_grad()函数来申请存储梯度所需要的内存。要对一个函数求关于某个变量求梯度就用那个变量名来调用attach_grad()函数，如 $y={x}^\mathsf{T}{x}$ 求有关变量x的梯度，则：
x.attach_grad()

2、调⽤record函数来要求MXNet记录与求梯度有关的计算。原因是为了减少计算和内存开销，默认条件下MXNet不会记录⽤于求梯度的计算，所以需要自己要求。使用方法是比如对函数y求梯度：

with autograd.record():
	y = 2 * nd.dot(x.T, x)

3、求梯度。如 $y={x}^\mathsf{T}{x}$ 关于 $x$ 的梯度应该是 $4 x$ :

x.grad

二、例子
我们给上面的 $x$ 赋值 $x=[0,1,2,3]^\mathsf{T}$ ，并按照上面的步骤求出它的梯度：

from mxnet import autograd, nd
x = nd.arange(4).reshape((4, 1))
x.attach_grad()
with autograd.record():
	y = 2 * nd.dot(x.T, x)
y.backward()
print(x.grad)

运行结果如下所示：

[[  0.]
 [  4.]
 [  8.]
 [ 12.]]

comli_cn

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
mxnet中自动求梯度

我用的是mxnet包里面的自动求梯度的模块autograd。一、在autograd下求梯度一般要进行一下几个步骤：1、调用attach_grad()函数来申请存储梯度所需要的内存。要对一个函数求关于某个变量求梯度就用那个变量名来调用attach_grad()函数，如y=xTxy={x}^\mathsf{T}{x}y=xTx求有关变量x的梯度，则：x.attach_grad()2、调⽤rec...
复制链接

扫一扫