tensorflow保存进度以及继续训练
近期在跑一个基于cycleGan实现斑马与普通马的互相转化过程中,因为自己的电脑配置并不是很高,算了一下要跑大约50个小时,但是文件里没有写断点继续训练的代码,通过学习查阅一些相关知识,实现了tensorflow的进度保存以及继续训练。
环境
windows7
python3.7
tensorflow-gpu 1.13.1
文件结构
tensorflow在生成checkpoint文件时会生成3种后缀的文件。
.meta文件保存了当前图结构
.index文件保存了当前参数名
.data文件保存了当前参数值
保存checkpoint
实例化对象
saver = tf.train.Saver