d2l自动微分练习

最新推荐文章于 2023-04-15 11:43:00 发布

Elong_Hu

最新推荐文章于 2023-04-15 11:43:00 发布

阅读量2.8k

点赞数 1

分类专栏：数据科学家之路 Machine Learning 深度学习文章标签： python 深度学习机器学习

本文链接：https://blog.csdn.net/qq_34993631/article/details/122555900

版权

数据科学家之路同时被 3 个专栏收录

50 篇文章 6 订阅

订阅专栏

Machine Learning

35 篇文章 4 订阅

订阅专栏

深度学习

3 篇文章 0 订阅

订阅专栏

课后题

1. 为什么计算二阶导数比一阶导数的开销要更大？

简单来说就是会造成梯度维数的增大，标量对向量的求导是一个向量，在此基础上再对向量求导就会变成一个矩阵，进一步的会变成张量。

2. 在运行反向传播函数之后，立即再次运行它，看看会发生什么。

运行时异常，之前的结果已经被释放，而且给出了提示，说要使用retain_graph=True就能够保证结果不被释放。

RuntimeError: Trying to backward through the graph a second time, but the saved intermediate results have already been freed. Specify retain_graph=True when calling backward the first time.

3. 在控制流的例子中，我们计算`d`关于`a`的导数，如果我们将变量`a`更改为随机向量或矩阵，会发生什么？

RuntimeError: grad can be implicitly created only for scalar outputs
梯度的计算只针对标量，然后如果是向量则先使用sum()然后再进行计算梯度。

4. 重新设计一个求控制流梯度的例子，运行并分析结果。

待讨论。

5. 使 $f(x)=\sin(x)$ ，绘制 $f (x)$ 和 $\frac{df(x)}{dx}$ 的图像，其中后者不使用 $f'(x)=\cos(x)$ 。

%matplotlib inline
import matplotlib.pylab as plt
from matplotlib.ticker import FuncFormatter, MultipleLocator
import numpy as np

# 让x打满区间，事实上是创建了-3π到3π的100个点
x = np.linspace(-3 * np.pi,3 * np.pi,100)
# 构建一个tensor，存放梯度，存放中间结果
x1= torch.tensor(x, requires_grad=True)
# 定义函数y
y = torch.sin(x1)
y.sum().backward()
x1.grad
# 在此已经得出了x的对应的点的导数值
# 现在开始画出图像
f,ax=plt.subplots(1)
# 画出sin
ax.plot(x,np.sin(x),label="sin()")
# 画出sin的梯度
ax.plot(x,x1.grad,label="gradient of sin(x)")
# 设置标签
ax.legend(loc='upper center', shadow=True)
plt.show()

sin与它的梯度

Elong_Hu

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
d2l自动微分练习

课后题自动微分自动微分为什么计算二阶导数比一阶导数的开销要更大？简单来说就是会造成梯度维数的增大，标量对向量的求导是一个向量，在此基础上再对向量求导就会变成一个矩阵，进一步的会变成张量。在运行反向传播函数之后，立即再次运行它，看看会发生什么。运行时异常，之前的结果已经被释放，而且给出了提示，说要使用retain_graph=True就能够保证结果不被释放。RuntimeError: Trying to backward through the graph a second time, but
复制链接

扫一扫