大坑:
前几天在服务器上的虚拟环境上使用gpu同时运行两个处理大数据集的程序,结果跑着跑着突然中断。原因很玄幻,是虚拟环境下的与运行的程序相关的包丢失了:pytorch,dgl等等都丢失了。而在程序刚开始运行时候这些包都存在。
直接原因及推测根本原因:
直接原因是两个程序在同一anaconda建立的虚拟环境下运行。
推测根本原因因为程序要处理的数据集很大,会占用大量cpu和gpu空间,在同一虚拟环境下运行会导致冲突?只是推测,如果有知道的朋友欢迎告诉我具体原因
解决方案:
只需要建立两个相同配置的虚拟环境,分别运行两个程序,就再没有出现这个问题。