笔记本:ROG Zephyrus G14
双系统:ubuntu-18.04.5-desktop-amd64
CUDA:11.0
cuDNN: v8.0.5
1. 从windows中格式化ubuntu存储空间
2. 删除ubuntu的引导
3. 用系统盘重装:
ubuntu18.04镜像下载:
Ubuntu 18.04.5 LTS (Bionic Beaver)
http://releases.ubuntu.com/18.04/
踩坑:
选择了同一个镜像,用两个不同的软件写入镜像。
用Rufus制作的启动盘可以自动加载网络,安装上有网卡驱动。
用UltralSO制作的启动盘在install过程中不能加载网络,安装成功后上无网卡驱动, 网络相关的配置无法启动。手动安装网卡驱动无法工作,免驱无线网卡无法工作。
解决:
选择靠谱的镜像制作软件,亲测Rufus有效。
备注(避坑策略):
为了避免误装镜像,可以先在虚拟机测试,省时省力。
如果要测试网络,要先配置虚拟机网络去除桥接模式。
4. install ubuntu后,第一次重启
问题:
进入默认的ubuntu,无法进入图形化界面,只能通过recovery模式进入。
ubuntu freezing on boot with nvidia driver installed
原因:
通用 Canonical Ubuntu 介质(一些 OEM Dell 介质)或其他 Linux 介质无法正常启动至实时环境或安装程序,系统反而会挂起或卡住。
解决方案:
在引导之前通过设置“nomodeset”选项来禁用英特尔显卡功能。
第一部分:实现一次性引导
第二部分:永久性修改引导以解决。
具体步骤参考博主单独博文:
ubuntu系统安装,无法进入图形化界面:ubuntu freezing on boot with nvidia driver installed
原理解释:
最新的内核已经把视频模式设置嵌入内核中,所以所有显卡硬件程序的指定时钟和寄存器当图形服务器启动时在内核进行而不是图形设备运行。
这使得我们在启动时可以看到不闪的和高分辨率的好看的启动界面。
但是,在某些视频卡它不能正常工作而现实黑屏,增加nomodeset参数则告诉内核不要加载显卡而用BIOS模式直到图形界面运行。
此时禁用了nomodeset 加载图形驱动程序,并且它引起的冲突消失了。 登录系统并查看所有内容后,因为显卡已再次加载。
5. 进入图形化界面后 ,配kksw
6. 安装rog-core
ROG 幻14 完美安装Linux Ubuntu LTS 20.04 解决各种问题
sudo apt update
sudo apt install rustc cargo make -y
sudo apt install libusb-1.0-0-dev -y
sudo apt install libdbus-1-dev -y
sudo apt install llvm -y
sudo apt install libclang-dev -y
sudo apt-get install clang -y
sudo apt-get install git -y
git clone https://github.com/flukejones/rog-core.git
cd rog-core
make
sudo make install
踩坑:
如成功安装libusb-1.0-0-dev和libdbus-1-dev后,执行仍然报错缺少dbus,只需reboot后再make即可。
7. 安装显卡驱动
踩坑1:
用apt安装的开源的NVIDIA驱动,由于apt管理不好,在安装时会同时下载几个版本的显卡驱动,会导致显卡驱动无法启用。反复卸载和重装后,发现此问题。
因此,不要用apt 安装显卡驱动,apt对显卡的管理不好。采用保守且靠谱的办法:手动安装闭源驱动。
解决:
从NVIDIA官网下载指定驱动,用闭源方法安装。
附:NVIDIA可选显卡驱动链接:NVIDIA 驱动程序下载
具体步骤:
1.先卸载干净有已有显卡驱动
如是apt安装的,用该命令卸载:
sudo apt-get remove --purge nvidia*
如果使用.run文件安装的,用该命令卸载:
sudo ./NVIDIA.run --uninstall
./NVIDIA.run是下载下来的run文件的所在位置及名称
2.测试显卡驱动是否卸载:
$ nvidia-smi
该命令执行的结果应该为无显卡驱动,建议安装。而不是无法与显卡驱动通信,如果是显示无法与显卡驱动通信,则说明显卡驱动仍存在,只是无法成功应用。
3. 安装显卡驱动:
1.禁掉nouveau
在/etc/modprobe.d 编辑 blacklist.conf
blacklist nouveau
options nouveau modeset=0
2.刷新内核
sudo update-initramfs -u
3.重启
reboot
4.进入tty模式安装显卡驱动
sudo init 3
Crtl +Alt+F6 进入tty模式
5.查看是否禁用了nouveau
lsmod | grep nouveau
6.安装显卡驱动
sh ./NVIDIA-Linux*.bin
至此,显卡驱动安装成功。闭源驱动不需要修改NVIDIA配置文件和bashrc文件。
踩坑2:
不要下载太新的驱动,会无法启动。
8. 安装CUDA
1.查看CUDA官方文档,安装与显卡驱动版本相符合的CUDA。
CUDA Toolkit Major Component Versions
2.选择对应版本,下载CUDA文件。
CUDA官网下载地址
要下载runfile文件
3.安装CUDA(以CUDA11.0为例)
wget http://developer.download.nvidia.com/compute/cuda/11.0.2/local_installers/cuda_11.0.2_450.51.05_linux.run
sudo sh cuda_11.0.2_450.51.05_linux.run
4.修改bashrc
$ code ~/.bashrc
$ export PATH=/usr/local/cuda/bin:$PATH
export $ LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
$ source ~/.bashrc
5.查看环境变量是否配置成功:
nvcc -V
成功会显示CUDA信息
6.验证显卡驱动和CUDA是否已被启用并可被Pytorch访问:
测试:
>>import torch # 可以import说明Pytorch安装成功
>>torch.cuda.is_available() #返回True则说明Pytorch可以在当前GPU上使用
9.cuDNN
具体步骤参见另一篇单独博文:
(还没整理好,有空再整理,草稿中…
注意安装完cuDNN要测试:
cp -r /usr/src/cudnn_samples_v8/ ~
cd ~/cudnn_samples_v8/mnistCUDNN/
make clean && make
./mnistCUDNN
test passed 则说明安装成功
10. 部署其他应用:
pytorch、conda…
(遗留问题:外接显示器仍然没有解决,不明白为什么核显ADM显卡驱动已安装(通过命令测试),但是不能外接显示器)
(遗留问题:QQ和微信字体显示不出来,偶尔乱码