tensorflow:不要在session中定义运算

最近在做项目时,总是会有程序崩溃的问题,系统也没有任何提示。最后通过监控系统发现是内存溢出造成的。

追查下去,发现一段类似这样的代码,在session中调用tensorflow的api进行运算:

import tensorflow as tf
X = tf.constant([[1,2,3], [3,2,4]], dtype=tf.float32)
W = tf.constant([[1,1],[2,2],[3,3]], dtype=tf.float32)
bias = tf.constant([1, 2], dtype=tf.float32)
y = tf.nn.softmax(tf.matmul(X, W) + bias)

with tf.Session() as sess:

    for i in range(10):
        print(i)
        sess.run(tf.nn.softmax(tf.matmul(X, W) + bias))

    writer = tf.compat.v1.summary.FileWriter("./graph", sess.graph)
    writer.close()

使用tensorboard查看内存泄漏的原因:

将计算图展开为

当然,这里只是展开了softmax,其他节点也可以类似展开。

可以看到,在session中定义计算节点,存在一个很大的风险,就是会在计算图中产生新的图节点,如果像我这样使用for循环运算,那么节点数会无限增加,注意不仅仅是softmax节点在增加,其他计算节点也在增加,这样的开销会越来越大,直至程序崩溃。

为了解决这个问题,我们应该使用上面定义的y的等式,在进入session前就已经将计算图定义好,在session中直接调用,而不是重新搭建。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值