最近在跑程序时,出现过好几次这个问题,当时在官方tensorflow的github上查到了这个问题,见:https://github.com/tensorflow/tensorflow/issues/39712,工作人员回复让试一下tf-nightly(应该是最新迭代的版本),但由于tensorflow版本多人再用,所以也没试这种方法。
今天又碰到这个问题,研究了一下,下面首先给出我这里几次碰到这个问题的背景:
(1)由于有多人在使用GPU,所以前几次都是在GPU占用比较大的情况下,然后我跑个程序就出现了这个问题。到了第二天我再跑的时候,又能正常跑了,此时看起来很玄学呀。
(2)今天刚好别人用完,然后我接着使用,就又出现了这个问题。
下面给全这个问题:tensorflow/stream_executor/cuda/ptxas_utils.cc:181] Non-OK-status: tensorflow::Env::Default()->DeleteFile(ptx_path) status: Not found: /tmp/tempfile-ml5.trusfort.test-5dffb700-40074-5b04cc6948171; No such file or directory。
再来看看正常状态: