昇思MindSpore学习入门-高阶自动微分

最新推荐文章于 2024-10-01 05:04:32 发布

谷晓光

最新推荐文章于 2024-10-01 05:04:32 发布

阅读量1.1k

点赞数 13

文章标签： ai 昇思 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/buw369521/article/details/140694331

版权

mindspore.ops模块提供的grad和value_and_grad接口可以生成网络模型的梯度。grad计算网络梯度，value_and_grad同时计算网络的正向输出和梯度。本文主要介绍如何使用grad接口的主要功能，包括一阶、二阶求导，单独对输入或网络权重求导，返回辅助变量，以及如何停止计算梯度。

一阶求导

计算一阶导数方法：mindspore.grad，其中参数使用方式为：

fn：待求导的函数或网络。
grad_position：指定求导输入位置的索引。若为int类型，表示对单个输入求导；若为tuple类型，表示对tuple内索引的位置求导，其中索引从0开始；若是None，表示不对输入求导，这种场景下，weights非None。默认值：0。
weights：训练网络中需要返回梯度的网络变量。一般可通过weights = net.trainable_params()获取。默认值：None。
has_aux：是否返回辅助参数的标志。若为True，fn输出数量必须超过一个，其中只有fn第一个输出参与求导，其他输出值将直接返回。默认值：False。

下面先构建自定义网络模型Net，再对其进行一阶求导，通过这样一个例子对grad接口的使用方式做简单介绍，即公式：

𝑓(𝑥,𝑦)=𝑥∗𝑥∗𝑦∗𝑧

首先定义网络模型Net、输入x和输入y：

import numpy as np

from mindspore import ops, Tensor

import mindspore.nn as nn

import mindspore as ms

# 定义输入x和y

x = Tensor([3.0], dtype=ms.float32)

y = Tensor([5.0], dtype=ms.float32)

class Net(nn.Cell):

def __init__(self):

super(Net, self).__init__()

self.z = ms.Parameter(ms.Tensor(np.array([1.0], np.float32)), name='z')

def construct(self, x, y):

out = x * x * y * self.z

return out

对输入求一阶导

对输入x, y进行求导，需要将grad_position设置成(0, 1)：

对权重进行求导

对权重z进行求导，这里不需要对输入求导，将grad_position设置成None：

返回辅助变量

同时对输入和权重求导，其中只有第一个输出参与求导，示例代码如下：

停止计算梯度

可以使用stop_gradient来停止计算指定算子的梯度，从而消除该算子对梯度的影响。

在上面一阶求导使用的矩阵相乘网络模型的基础上，再增加一个算子out2并禁止计算其梯度，得到自定义网络Net2，然后看一下对输入的求导结果情况。

示例代码如下：

从上面的打印可以看出，由于对out2设置了stop_gradient，所以out2没有对梯度计算有任何的贡献，其输出结果与未加out2算子时一致。

下面删除out2 = stop_gradient(out2)，再来看一下输出结果。示例代码为：

打印结果可以看出，把out2算子的梯度也计算进去之后，由于out2和out1算子完全相同，因此它们产生的梯度也完全相同，所以可以看到，结果中每一项的值都变为了原来的两倍（存在精度误差）。

高阶求导

高阶微分在AI支持科学计算、二阶优化等领域均有应用。如分子动力学模拟中，利用神经网络训练势能时，损失函数中需计算神经网络输出对输入的导数，则反向传播便存在损失函数对输入、权重的二阶交叉导数。

此外，AI求解微分方程（如PINNs方法）还会存在输出对输入的二阶导数。又如二阶优化中，为了能够让神经网络快速收敛，牛顿法等需计算损失函数对权重的二阶导数。

MindSpore可通过多次求导的方式支持高阶导数，下面通过几类例子展开阐述。

单输入单输出高阶导数

例如Sin算子，其公式为：

𝑓(𝑥)=𝑠𝑖𝑛(𝑥)

其一阶导数、二阶导数为：

其二阶导数（-Sin）实现如下：

从上面的打印结果可以看出，−𝑠𝑖𝑛(3.1415926)的值接近于0。

单输入多输出高阶导数

对如下公式求导：

(1)𝑓(𝑥)=(𝑓1(𝑥),𝑓2(𝑥))

其中：

(2)𝑓1(𝑥)=𝑠𝑖𝑛(𝑥)

(3)𝑓2(𝑥)=𝑐𝑜𝑠(𝑥)

梯度计算时由于MindSpore采用的是反向自动微分机制，会对输出结果求和后再对输入求导。因此其一阶导数是：

(4)𝑓′(𝑥)=𝑐𝑜𝑠(𝑥)−𝑠𝑖𝑛(𝑥)

其二阶导数为：

(5)𝑓″(𝑥)=−𝑠𝑖𝑛(𝑥)−𝑐𝑜𝑠(𝑥)

从上面的打印结果可以看出，−𝑠𝑖𝑛(3.1415926)−𝑐𝑜𝑠(3.1415926)的值接近于1。

多输入多输出高阶导数

对如下公式求导：

(1)𝑓(𝑥,𝑦)=(𝑓1(𝑥,𝑦),𝑓2(𝑥,𝑦))

其中：

(2)𝑓1(𝑥,𝑦)=𝑠𝑖𝑛(𝑥)−𝑐𝑜𝑠(𝑦)

(3)𝑓2(𝑥,𝑦)=𝑐𝑜𝑠(𝑥)−𝑠𝑖𝑛(𝑦)

梯度计算时由于MindSpore采用的是反向自动微分机制，会对输出结果求和后再对输入求导。

求和：

(4)∑𝑜𝑢𝑡𝑝𝑢𝑡=𝑠𝑖𝑛(𝑥)+𝑐𝑜𝑠(𝑥)−𝑠𝑖𝑛(𝑦)−𝑐𝑜𝑠(𝑦)

输出和关于输入𝑥的一阶导数为：

(5)d∑𝑜𝑢𝑡𝑝𝑢𝑡d𝑥=𝑐𝑜𝑠(𝑥)−𝑠𝑖𝑛(𝑥)

输出和关于输入𝑥的二阶导数为：

(6)d∑𝑜𝑢𝑡𝑝𝑢𝑡2d2𝑥=−𝑠𝑖𝑛(𝑥)−𝑐𝑜𝑠(𝑥)

输出和关于输入𝑦的一阶导数为：

(7)d∑𝑜𝑢𝑡𝑝𝑢𝑡d𝑦=−𝑐𝑜𝑠(𝑦)+𝑠𝑖𝑛(𝑦)

输出和关于输入𝑦的二阶导数为：

(8)d∑𝑜𝑢𝑡𝑝𝑢𝑡2d2𝑦=𝑠𝑖𝑛(𝑦)+𝑐𝑜𝑠(𝑦)

关注

13
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄8年

107
原创

1343
点赞

1045
收藏

987
粉丝

关注

私信

热门文章

分类专栏

CDA数据分析师 7篇
python 40篇
numpy 1篇
数据库 1篇

最新评论

python之tkinter库的grid布局
muzi_admin: 引用「# 取消按钮在网格内靠右」这里的W根据上边的描述，应该靠左吧。
python第三节：Str字符串类型（4）
CSDN-Ada助手: 恭喜您写了第19篇博客，标题为“python第三节：Str字符串类型（4）”！您的持续创作令人钦佩，对于Python的学习和分享精益求精，让读者受益匪浅。希望您能继续保持创作的热情，不断提升自己的写作技巧和内容深度。或许可以考虑结合实际案例或者深入探讨Python在特定领域的应用，为读者带来更多价值。期待您的下一篇精彩文章！
python第三节：Str字符串类型（4）
JJJ69: 不错，学到了很多，
第二节变量、注释、数据类型
CSDN-Ada助手: 恭喜您写完了第15篇博客！标题“第二节变量、注释、数据类型”听起来非常有趣。您的坚持和创作热情真的非常值得赞赏。在这篇博客中，您提到了变量、注释和数据类型，这些对于初学者来说是非常重要的基础知识。我希望您能够继续发掘这个主题，深入讲解每个概念的具体用途和注意事项。此外，您还可以考虑分享一些实际应用的案例，帮助读者更好地理解这些概念。期待您的下一篇博客！
python第一节：简介、下载、安装
CSDN-Ada助手: 恭喜您写了第14篇博客！标题为“python第一节：简介、下载、安装”，非常棒的主题选择。您的博客内容对初学者来说肯定非常有帮助。不过，我想提供一些建议，以便您持续创作。下一步，您可以考虑深入探讨Python的基本语法和数据类型，或者分享一些实际应用案例。这样更多的读者将能够从您的博客中获得更多的知识和实践经验。再次恭喜您，并期待您的下一篇博客！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。