tensorflow—tf.gradients()简单实用教程

最新推荐文章于 2025-02-25 16:25:49 发布

hustqb

最新推荐文章于 2025-02-25 16:25:49 发布

阅读量6.8w

点赞数 59

分类专栏： TensorFlow

本文链接：https://blog.csdn.net/hustqb/article/details/80260002

版权

本文是TensorFlow的tf.gradients()函数使用教程，介绍了如何进行梯度计算，包括基本实践、参数grad_ys和stop_gradients的用法。以线性回归为例展示梯度下降的过程，并通过示例解释了grad_ys加权求导和stop_gradients停止特定操作符梯度计算的功能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

声明：

参考官方文档
参考tensorflow学习笔记（三十）
关于神经网络中的梯度计算，推荐吴恩达的deeplearning公开课

tf.gradients()

在tensorflow中，tf.gradients()的参数如下：

tf.gradients(ys, xs, 
			 grad_ys=None, 
			 name='gradients',
			 colocate_gradients_with_ops=False,
			 gate_gradients=False,
			 aggregation_method=None,
			 stop_gradients=None)

先不给出参数的意义~

对求导函数而言，其主要功能即求导公式： $\frac {\partial y}{\partial x}$ 。在tensorflow中， $y$ 和 $x$ 都是tensor。

更进一步，tf.gradients()接受求导值ys和xs不仅可以是tensor，还可以是list，形如[tensor1, tensor2, …, tensorn]。当ys和xs都是list时，它们的求导关系为：

gradients() adds ops to the graph to output the derivatives of ys with respect to xs. It returns a list of Tensor of length len(xs) where each tensor is the sum(dy/dx) for y in ys.

意思是：

tf.gradients()实现ys对xs求导
求导返回值是一个list，list的长度等于len(xs)
假设返回值是[grad1, grad2, grad3]，ys=[y1, y2]，xs=[x1, x2, x3]。则，真实的计算过程为:
- $\frac {y1}{x1} + \frac {y2}{x1}$

最低0.47元/天解锁文章