最近在煩惱如何在自己筆電中進行腳本驗證然後把腳本送到運算平台進行訓練...
但由於超算中心使用Ubuntu 而我使用的是Win11筆電
一開始在想著用傳統方法在自己電腦裝個VM然後再安裝Ubuntu就行
結果後來還好有同路人踩坑了
然後果斷棄坑(雖然前後也搞了2 3天時間 TMD, 光搞與本機文檔共享就搞了超級久)
虚拟机无敌大坑,安装不了cuda和cudnn_虚拟机无法安装cuda-CSDN博客
回歸正題...
這邊的安裝教學是先從假設你已經有辦法安裝WSL2 然後可以正常的Boot up 和 down 以及本機已經安裝了Nvidia軀動
我筆電的顯卡是Win11 和 GTX3080Ti
那麼第一步是先啟動回之前的部署完成的乾淨Distribution (其實個人理解就是Docker的Container只是換了個名字)
wsl --distribution WSL2的Distrubtion名字 --user root帳號名
然後執行檢查看能否跑出顯卡訊息
nvidia-smi
記下這邊的CUDA版本, 這就是自己筆電所能安裝Cuda Toolkit 的天花版, 然後去CUDA Toolkit Archive | NVIDIA Developer 找了我想裝的CUDA Toolkit
接下來就是跟著這邊操作一步步來
wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-wsl-ubuntu.pin
sudo mv cuda-wsl-ubuntu.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget https://developer.download.nvidia.com/compute/cuda/12.3.0/local_installers/cuda-repo-wsl-ubuntu-12-3-local_12.3.0-1_amd64.deb
這邊是小坑雖然代碼跑了, 但安裝未完成
sudo dpkg -i cuda-repo-wsl-ubuntu-12-3-local_12.3.0-1_amd64.deb
然後需要多一步操作之後再重新執行安裝就會顯示成功
sudo cp /var/cuda-repo-wsl-ubuntu-12-3-local/cuda-*-keyring.gpg /usr/share/keyrings/
sudo dpkg -i cuda-repo-wsl-ubuntu-12-3-local_12.3.0-1_amd64.deb
sudo apt-get update
sudo apt-get -y install cuda-toolkit-12-3
雖然有報錯, 但可以不用理會, 有爬了一下文是說WSL2雖然有CUDA載入, 但不是完全全部功能都匹配.
再來就是把CUDA加入系統參數之中
cd /usr/local/cuda/bin/
pwd
刷新路徑, 然後修改系統參數
cd
nano .bashrc
把剛剛那一行CUDA位置寫到這文檔的最後一句
export PATH=$PATH:/usr/local/cuda/bin
按Ctrl+X, y 然後enter 保存修改, 然後重啟WSL2
exit
wsl --shutdown
wsl --distribution <Distribtuion名字> --user <Root帳號>
重啟WSL2 之後輸出系統所有參數看看有沒有加入成功
echo $PATH
檢查NVCC版本
nvcc --version
檢查Python 版本
python3 --version
安裝Pip3
sudo apt install python3-pip
安裝PyTorch
pip3 install torch torchvision torchaudio
檢查CUDA
python3
import torch
torch.cuda.get_device_name(0)
torch.cuda.is_available()
torch.cuda.device_count()
torch.cuda.current_device()
終於可以上線 本地驗證深學腳本了...哭
有幫到大家的話, 請點讚, 寫這份筆記真的挺耗時間, 但只是身為深學人想為這個領域做點小貢獻~