今天到了一台8卡GPU的服务器,记录下Setup的步骤。
系统已装好:
查看当前硬盘
df -lh
数据盘和本地盘都还没分区和挂载上去。
查看当前系统所有块设备信息:
lsblk
已分区和已挂载的盘:
/dev/vda
是系统盘,大小为 40G,其中/dev/vda1
是 EFI 分区,挂载在/boot/efi
,/dev/vda2
是根分区,挂载在/
。
未分区的盘:
/dev/vdb
是一个未分区的磁盘,大小为 4.9T。/dev/nvme0n1
是一个未分区的 NVMe 磁盘,大小为 1.7T。/dev/nvme1n1
是另一个未分区的 NVMe 磁盘,大小为 1.7T。
用fdisk对硬盘/dev/nvme0n1进行分区:
fdisk /dev/nvme0n1
再次查看分区信息:
lsblk
创建分区成功。
格式化磁盘分区
mkfs.ext4 /dev/nvme0n1p1
格式化输出
创建挂载目录
mkdir /mnt/nvme0n1p1
将分区挂载到相应目录上
mount /dev/nvme0n1p1 /mnt/nvme0n1p1
查看已挂载的硬盘
df -h
用fdisk对硬盘/dev/nvme1n1进行分区:
fdisk /dev/nvme1n1
再次查看分区信息:
lsblk
格式化磁盘分区
mkfs.ext4 /dev/nvme1n1p1
创建挂载目录
mkdir /mnt/nvme1n1p1
将分区挂载到相应目录上
mount /dev/nvme1n1p1 /mnt/nvme1n1p1
查看已挂载的硬盘
df -h
使用parted分区vdb
parted /dev/vdb
查看分区信息
lsblk
将分区格式化为ext4格式
mkfs.ext4 /dev/vdb1
创建文件夹
mkdir /home/vdb1
挂载
mount /dev/vdb1 /home/vdb1
并没有完全用上分区,在Parted那一步可以resizepart 1 4 和 mkpart primary 4 1.37再设置一个分区,umount /dev/vdb1这个源设备,mkfs.ext4 /dev/vdb1和mkfs.ext4 /dev/vdb2格式化这两个分区。再创建一个文件夹mkdir /home/vdb2,最后将两个分区挂载到相应文件夹mount /dev/vdb1 /home/vdb1和mount /dev/vdb2 /home/vdb2。
更改上述挂载好的文件夹,使得所有用户都能访问修改:
chmod -R 777 /mnt/nvme0n1p1
chmod -R 777 /mnt/nvme1n1p1
chmod -R 777 /home/vdb1
chmod -R 777 /home/vdb2
检查GPU驱动是否安装。
nvidia-smi
已安装。
检查cuda是否安装。
nvcc -V
未安装,直接使用apt安装。
创建账号
查看public用户默认shell
grep public /etc/passwd
将/bin/sh改为/bin/bash。
登录public用户配置conda环境。
为了减少系统空间的占用,设置软链接。
mkdir /mnt/nvme0n1p1/public
ln -s /mnt/nvme0n1p1/public public
Reference
linux添加用户出现错误/usr/bin/xauth: file /home/chenwi/.Xauthority does not exist