1. 背景
在使用tensorflow 1.x版本来跑目标检测算法时,发现在加载官方与训练模型时出现上述错误,上网找了好几种解释,但是都没有成功。
分别是:
- 模型的checkpoint路径太长,要改短一点。
- 模型的checkpoint路径不能使用绝对路径,要使用相对路径。
但是感觉都没有从本质上把问题讲清楚,随即搜索了一下对应的文件,发现出问题的是在这行代码,如图。
因此找了官方的源码,一般来说,只需要填入sess和对应的ckpt路径就能重载训练时的参数用来进行继续训练或者进行数据的预测。
但是,此处我的ckpt文件保存如下
通过检查checkpoint文件发现,里面的内容如下:
保存的内容只是检查点,对于整个模型应该是整个保存文件夹下的这四个文件。于是,我的寻找思路就转到了从模型的检查点恢复模型的函数上。
2. 解决方案
调用get_checkpoint_state函数获取ckpt检查点对应的模型:
ckpt = tf.compat.v1.train.get_checkpoint_state({ckpt_dir})
其中ckpt_dir是保存有上述ckpt文件的目录。
再通过restore函数将模型重载:
saver.restore(sess, ckpt.model_checkpoint_path)
贴一个我的代码图:
至此,解决问题。