众所周知Tensorflow解决问题都是去构建不同类型的神经网络,但是神经网络结构变化万千,当神经网络的结构变得更加复杂、参数更多时,程序的可读性会变得非常差,而且这样也会导致程序的结构中有大量的冗余代码,降低编程效率,那么变量管理也就变大尤为重要,前面已经对如何管理tensorflow的变量进行了介绍tensorflow变量管理。
在我们训练模型的过程中,如果不小心由于某些原因退出,如果没有一个持久的保存模型的方法,那么训练好的模型将无法被使用,有的模型可能需要训练几个小时,甚至几天的时间,那么如果模型没有很好的保存,这样前面训练浪费的时间将复制东流,还要重新来过,tensorflow中自带可以保存模型的方法,但是很多童鞋对这块还不是很熟悉,下面博主就来介绍一下。
Tensorflow提供了一个非常简单的API来保存和还原一个神经网络模型。这个API就是tf.train.Saver类。以下代码给出了保存Tensorflow计算图的方法。
import tensorflow as tf
# 声明两个变量并计算他们的和
v1 = tf.Variable(tf.constant(1.0, shape=[1], name = "v1")
v2 = tf.Variable(tf.constant(2.0, shape=[1], name = "v2")
result = v1 + v2
init_op = tf.initialize_all_variables()
# 声明tf.train.Saver类用于保存模型
saver = tf.train.Saver()
with tf.Session() as sess:
sess.run(init_op)
# 将模型保存到/path/to/model/model.ckpt文件
saver.save(sess, "/path/to/model/model.ckpt")
上面的代码,通过saver.save函数将tensorflow模型保存到/path/to/model/model.ckpt文件中。tensorflow模型一般会存在后缀为.ckpt的文件中,虽然,上面的代码中只指定了一个文件路径,但是在这个文件目录下会出现三个文件。这是因为tensorflow会将计算图的结构和图上参数取值分开保存。
这三个文件分别为:model.ckpt.meta,它保存了Tensorflow计算图的结构,也就是神经网络的结构。model.ckpt,这个文件中保存了Tensorflow程序中每一个变量的取值。check.point,这个文件中保存了一个目录下所有的模型文件列表。
保存好了模型自然是要拿来用的,下面就介绍如何加载Tensorflow模型的方法:
import tensorflow as tf
# 使用和保存模型代码中一样的方式来声明变量
v1 = tf.Variable(tf.constant(1.0, shape=[1], name = "v1")
v2 = tf.Variable(tf.constant(2.0, shape=[1], name = "v2")
result = v1 + v2
saver = tf.train.Saver()
with tf.Session() as sess:
# 加载已经保存的模型,并通过已经保存的模型中变量的值来运算
saver.restore(sess, "/path/to/model/model.ckpt&#