1. RuntimeError: cuda runtime error THCStorage.cu:58
完完全全从一个工作站转移到另外一个工作站,程序就报错了,报错如下:
感谢smth的解答点此
echo $LD_LIBRARY_PATH
unset LD_LIBRARY_PATH
两步即可
2. OSError: [Errno 12] Cannot allocate memory
在工作站上跑程序,把batchsize设为1仍然有这个问题,查看不是GPU的out of memory, 而是RAM的问题
所以如何提高RAM的空间大小呢
感谢Nima的回答
$sudo swapon -s #查看目前有多少的RAM
$sudo dd if=/dev/zero of=/swapfile bs=1024 count=1024k
$sudo mkswap /swapfile
$sudo swapon /swapfile # Add 1GB RAM
$sudo vim /etc/fstab
/swapfile none swap sw 0 0 #Add the following line to the fstab to make the swap permanent.
$sudo swapon -s #查看目前有多少的RAM,此时会多出来一些的
strings /home/qhu/anaconda3/bin/../lib/libgomp.so.1 |grep GOMP
看看是否有GOMP_4
如果没有 用find -name
libgomp.so.1*查找可用路径 一个一个用strings /home/qhu/anaconda3/pkgs/libgcc-ng-7.2.0-hdf63c60_3/x86_64-conda_cos6-linux-gnu/sysroot/lib/libgomp.so.1 |grep GOMP试过去 看看哪个有GOMP_4
哪个有 就在.bashrc中添加路径
export LD_PRELOAD=/home/qhu/anaconda3/pkgs/libgcc-ng-7.2.0-hdf63c60_3/x86_64-conda_cos6-linux-gnu/sysroot/lib/libgomp.so.1:$LD_PRELOAD