在Windows上调试一个混合精度模型量化工程时,出现了题目中的错误,具体报错见下面截图:
使用的是我的笔记本电脑,上面配有一个低端GPU:NVIDIA GeForce MX570,2G显存。通过nvidia-smi命令查看CUDA信息,可以看到CUDA版本为11.7。
查看Pytorch版本,发现是CPU版本。
于是在该环境中,重装pytorch,重装之后,发现仍然存在该问题。然后通过命令行卸载pytorch: pip uninstall torch,卸载完成之后,再次执行安装命令:
pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
以上命令来自:https://pytorch.org/get-started/locally/
安装完成后,重启运行环境。之后,在命令行中查看pytorch版本,发现已经是GPU版本了。
回到最初的模型量化工程,继续执行原来的程序,原来的错误已经消失,但又出现另外一个错误,提示显存不足,于是尝试减小batch-size,由128改为64,再次执行,OK了。