问题:NotFoundError: Key Variable_10 not found in checkpoint
网友解决办法:
- 问题2:保存后模型恢复出来用于测试:NotFoundError: Key Variable_10 not found in
checkpoint
分析原因:如果模型训练完保存后直接加载,相当于变量在前后定义了两次,第一次创建的变量name=“weight”,测试时
创建的变量虽然name=“weight”,但是实际上name会变成"weight_1"(weight_n-1),我们在保存的checkpoint中搜索的就是
weight_n-1,因为搜索不到所以会报错。
网上各种查找后有两种解决方法:
(1)在加载过程中,定义 name 相同的变量前面加 tf.reset_default_graph() 清除默认图的堆栈,并设置全局图为默认图 ;
(2)保存模型后,不马上加载,或 restart kernel后,再加载测试,又不会出错。
我自己尝试了第二种方法,因为第二种方法简单,确实可行。
我的解决办法:
- 原因 是网络结构不同,不用试了。