Tensorflow核心要点

最新推荐文章于 2024-06-01 09:33:58 发布

AC_hell

最新推荐文章于 2024-06-01 09:33:58 发布

阅读量486

点赞数

分类专栏： tensorflow 文章标签： TensorFlow

本文链接：https://blog.csdn.net/AC_hell/article/details/86531157

版权

tensorflow 专栏收录该内容

1 篇文章

订阅专栏

TensorFlow与别的框架不同之处就是它按照当前存在的计算图来进行计算，而不是传统的按照我们的代码的顺序来执行计算，个人觉得这个才是理解TensorFlow的核心要点。在tensorflow中，是以计算图的方式来求值的，计算图在代码首次执行的时候就构建好了并存在内存中，因此之后调用sess.run求值都是根据当前存在的计算图来求的，且按照节点之间的依赖关系往前推导其依赖值，直到所有的依赖值已知（如Variable，placeholder，const等都是已知类型），不在依赖之中的不予计算，也就是说并不是简单地计算整个图。根据当前构建好的计算图来求值这句话很重要，看一个例子

import tensorflow as tf

a = tf.get_variable(name="a",initializer=tf.constant(0))

def add():
    print("add()")
    b = tf.add(a, 1)
    return b

c = add()

init = tf.group(tf.global_variables_initializer(), tf.local_variables_initializer())
sess = tf.Session()
sess.run(init)

print(c)
print(sess.run(c))
sess.run(tf.assign(a,1))
print(sess.run(c))

分析代码可知我们先创建了Variable a，且初始值为0，此时tensorflow内部模块捕捉到了这个信息，将计算图更新为

接着定义了一个 add() 函数，由于没有真正执行，tensorflow内部模块没有接受到任何信息，于是计算图仍为

紧接着 add() 被调用，于是输出 "add()"，然后将 a+1 赋值给 b，这下tensorflow内部模块又捕捉到了这个信息将计算图更新为

接着 b 的值又被赋给 c，于是计算图更新为

紧接着，我们将所有变量初始化，于是计算图变为

然后输出一下 c 并调用 print(sess.run(c)) 计算 c 的值，此时 c 依赖于 b，因此应先计算 b，由于 b 在 add() 中被计算，因此再次调用 add()，输出“add()”，然后计算b，b 依赖于 a，而 a 的值已知为 0，因此算出 b 为 1，于是 c 也为1，输出“1”。

接着通过 sess.run(tf.assign(a,1))，a 被重新赋值为 1，计算图更新为