2021-11-02 tensorflow训练时，meta文件不断增大，最终出现Aborted (core dumped)

最新推荐文章于 2024-01-29 22:05:50 发布

l@h

最新推荐文章于 2024-01-29 22:05:50 发布

阅读量810

点赞数

文章标签： tensorflow 人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44682956/article/details/121099435

版权

先实现图像合成，再用合成的图像进行分割。图像合成部分的代码是开源的，所以没有问题，然后我在合成代码的基础上加上分割，运行到step165时，出现错误：
在这里插入图片描述

查阅了很多资料，包括生成core文件，然后用gdb在linux环境下调试（gdb调试大多是针对c的，而我的是python），都没有解决问题。

突然，进logs查看保存的模型时，发现meta文件越来越大，甚至有1.7G，我再看另外代码保存的模型中，meta文件大小几乎没有发生变化，所以我意识到可能是因为计算图过大，导致内存溢出。

再查阅资料，发现可以在每次构图完成过后用这个函数：sess.graph.finalize()，再次运行程序，就会出错，然后根据出错的地方去修改代码。我出错的地方如下：
在这里插入图片描述
在softmax出错，然后把seg_out=tf.nn.softmax(seg_out)放进初始化的网络中

最终解决问题，meta文件的大小也没有随着训练次数增加而增大。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-11-02 tensorflow训练时，meta文件不断增大，最终出现Aborted (core dumped)

先实现图像合成，再用合成的图像进行分割。图像合成部分的代码是开源的，所以没有问题，然后我在合成代码的基础上加上分割，运行到step165时，出现错误：查阅了很多资料，包括生成core文件，然后用gdb在linux环境下调试（gdb调试大多是针对c的，而我的是python），都没有解决问题。突然，进logs查看保存的模型时，发现meta文件越来越大，甚至有1.7G，我再看另外代码保存的模型中，meta文件大小几乎没有发生变化，所以我意识到可能是因为计算图过大，导致内存溢出。再查阅资料，发现可以在每次构
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。