首先注意assign在tensorflow的操作是将改变当前节点的值,并将改变值后的节点返回,这是tensorflow的api。而等于号是python里的赋值语句,但与普通python赋值语句不同的是,由于通常tensorflow建图时右边的操作都是新建一个节点,所以这个等于号其实就是将变量的引用到这个新节点上。你只要分清哪些是tensorflow中的操作和哪些是python语言的操作,就能分清哪些是在建图,哪些只是在改变引用。
import tensorflow as tf
with tf.Graph().as_default():
a = tf.Variable(1, name="a")
assign_op = tf.assign(a, tf.add(a,1))
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
print sess.run(assign_op)
print a.eval()
print a.eval()
2
2
2
第一种,assign_op对a进行了赋值,因此sess.run(assign_op)运行后返回值的是2,由于assign是对原始节点修改值,而不是新建节点。因此a对应节点的值也变成了2。
import tensorflow as tf
with tf.Graph().as_default():
a = tf.Variable(1, name="a")
a = a + 1
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
print sess.run(a)
print a.eval()
print a.eval()
2
2
2
第二种,注意a = a + 1的实际操作是首先将右边a的节点加上1,这是一个新建节点操作,a+1返回的是这个新建节点,此时a = 新建节点。也就是a引用的节点地址变了。这是run(a)、a.eval()其实都不会修改原始节点name="a"的值,也就是始终为1,所以run(a)、a.eval()执行的都是1+1运算。
import tensorflow as tf
with tf.Graph().as_default():
a = tf.Variable(1, name="a")
a = tf.assign(a, tf.add(a,1))
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
print sess.run(a)
print a.eval()
print a.eval()
2
3
4
第三种,首先新建个节点name=“a”,再对这个节点采用assign操作,注意这个assign的操作被a给引用了。也就是每次运行run(a),a.eval()都是需要assign运行一次。这样,assign运行第一次,name="a"节点值变为2;assign运行第二次相当于2+1=3,同理第三次3+1。
import tensorflow as tf
counter = tf.Variable(0, name="counter")
one = tf.constant(1)
ten = tf.constant(10)
new_counter = tf.add(counter, one) # tf.add 相当于counter+one
assign = tf.assign(counter, new_counter)
result = tf.add(assign, ten)
init_op = tf.initialize_all_variables()
with tf.Session() as sess:
sess.run(init_op)
for _ in range(3):
print sess.run(counter)
print sess.run(result)