过完一个周末,原本可以运行的图像识别程序突然运行不了了,在调用GPU的使用一直卡住。
具体表现例如:运行PaddleOCR时,到了调用GPU这一步,程序就一直卡着不动,关也关不掉,强行kill掉则会变成一个僵尸进程,过几十秒会被系统回收。
测试了CUDA没有问题,测试cudnn时程序卡了很久。
网上搜暂时没有很明确的答案,官网查了一下T4显卡驱动的最新版本是440.118.02,而我目前机器上的驱动版本是440.33.x,于是尝试安装新版驱动试一下。
1.卸载驱动
执行下述命令进行卸载。
sudo /usr/bin/nvidia-uninstall
sudo apt-get --purge remove nvidia-*
sudo apt-get purge nvidia*
sudo apt-get purge libnvidia*
执行下述命令查看是否还有剩余没有卸载干净的软件包。
sudo dpkg --list |