TensorFlow Eager笔记

最新推荐文章于 2022-12-08 11:11:02 发布

yanhe156

最新推荐文章于 2022-12-08 11:11:02 发布

阅读量155

点赞数

分类专栏： TensorFlow Eager

本文链接：https://blog.csdn.net/yanhe156/article/details/84000620

版权

TensorFlow Eager 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

这篇博客介绍了在TensorFlow Eager环境中，如何定义损失函数和计算梯度，并指出与PyTorch的默认设置差异。作者通过实践发现，避免重复计算损失可以显著节省训练时间，例如在鸢尾花分类任务中，训练时间从7.2s减少到5.9s，且不影响最终结果。

摘要由CSDN通过智能技术生成

入门教程中，定义loss和grad的计算函数如下：

def loss(model, x, y):
  y_ = model(x)
  return tf.losses.sparse_softmax_cross_entropy(labels=y, logits=y_)

def grad(model, inputs, targets):
  with tf.GradientTape() as tape:
    loss_value = loss(model, inputs, targets)
  return tape.gradient(loss_value, model.variables)

不写with tf.GradientTape() as tape: 时应该就是相当于pytorch里的关闭梯度。也就是pytorch默认打开梯度，TF Eager默认关闭梯度，这一点还是不错的。

注意到，loss重复计算了啊，不如用一个函数。

def loss_and_grad(model, inputs, targets):
  with tf.GradientTape() as tape:
    loss_value = loss(model, inputs, targets)
  return loss_value, tape.gradient(loss_value, model.variables)