Linux系统训练模型进程被killed,其实类似于显存out of memory
文章目录一、寻找原因二、解决思路1.是否在模型中使用了list.append()2.在对dataset数据处理时是否使用了浅拷贝(对array直接使用=号)3.未完待续一、寻找原因Linux中进程被killed时没有任何提示。可以尝试使用命令(在任何目录下)sudo dmesg | tail -7查看出错日志。发现意思是要使用的虚拟内存(linux里也叫交换内存swap)不够了。我搞了半天的虚拟内存,不管用。后来我打开Linux中的系统监视器,盯着训练过程发现,是训练时内存被逐步填满,
原创
2022-04-28 15:29:33 ·
7419 阅读 ·
8 评论