Ubuntu服务器配置
目录
安装内容Ubuntu 18.04.3 desktop,cuda10.1,cudnn
1. 安装Ubuntu 18.04.3
-
用Rufus3.5 制作启动U盘,模式选择“GTP+UEFI”
-
安装过程中选择安装分区/sda,新建一个2G的分区作为efi启动分区
-
保留Home分区
Note:
A. 内存比较大时,不需要swap分区
B. 用别的工具,UEFI模式安装时会报错:the grub-pc package failed to install into /target/ will not boot
2. 配置网络
静态ip设置如下(需要向局域网管理员申请静态ip):
配置服务器过程中,建议使用拨号,可以接入外网。
删除系统的DHCP的连接,在/etc/network/
更改interfaces
的内容:
# interfaces(5) file used by ifup(8) and ifdown(8)
auto lo
iface lo inet loopback
auto eno1
iface eno1 inet static
address # IP
netmask 255.255.255.0
gateway # 网关
重启机器,关闭防火墙
ufw disable
拨号设置如下:
A. 关闭自动的网络,并取消自动连接
B. 命令行,输入 nm-connection-editor
, 添加 PPPOE,并设置自动连接。
3. 更换清华源
A. 备份源文件 cp /etc/apt/source.list /ect/apt/source.list.bak
B. 更换 source.list 内容,并更新源 apt-get update
# 默认注释了源码镜像以提高 apt update 速度,如有需要可自行取消注释
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-updates main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-updates main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-backports main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-backports main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-security main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ bionic-security main restricted universe multiverse
4. Ubuntu18.04 的 DNS 默认是注释的,需要手动添加(一定要添加)
vi /etc/system/resolved.conf
将原本注释的DNS 改为:
DNS=8.8.8.8 202.117.80.7
5. Ubuntu18.04 不自带 ifconfig 指令,需要安装网络工具
apt-get install net-tools
6. 更新软件
apt-get update && apt-get upgrade
7. 启动ssh登录,安装vim
apt-get install openssh-server openssh-client vim
8. 安装 vnc 及 mate 桌面环境
sudo apt-get install vnc4server
sudo apt install ubuntu-mate-core ubuntu-mate-desktop
参考网址:
https://www.linode.com/docs/applications/remote-desktop/install-vnc-on-ubuntu-16-04
https://www.htcp.net/880.html
9. 调试vncserver
vncserver :1 #会产生一个配置文件
vncserver -kill :1 #删掉该桌面,并修改配置文件
chmod +x /home/username/.vnc/xstartup #very important!!!!!!!!!!
vi /home/username/.vnc/xstartup
输入以下内容:
#!/bin/sh
# Uncomment the following two lines for normal desktop:
# unset SESSION_MANAGER
# exec /etc/X11/xinit/xinitrc
XDG_RUNTIME_DIR=$HOME/.vnc #very important!!!!!!!!!!
[ -x /etc/vnc/xstartup ] && exec /etc/vnc/xstartup
[ -r $HOME/.Xresources ] && xrdb $HOME/.Xresources
xsetroot -solid grey
vncconfig -iconic &
x-terminal-emulator -geometry 80x24+10+10 -ls -title "$VNCDESKTOP Desktop" &
x-window-manager &
mate-session &
重启vnc,连接
vncserver :1
10. cuda 安装前的准备
sudo apt-get install linux-source sysdig-dkms
sudo systemctl stop lightdm
apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
参考:
http://blog.csdn.net/autocyz/article/details/52299889
http://www.52nlp.cn/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E4%B8%BB%E6%9C%BA%E7%8E%AF%E5%A2%83%E9%85%8D%E7%BD%AE-ubuntu-16-04-nvidia-gtx-1080-cuda-8
http://blog.csdn.net/feedinglife/article/details/70321713
http://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#runfile-uninstallation
10.1. 禁用nouveau
执行以下命令:
vi /etc/modprobe.d/blacklist-nouveau.conf
写入以下内容:
blacklist nouveau
options nouveau modeset=0
执行:
update-initramfs -u
10.2. 修改 grub 设置开机启动到命令行界面
执行:
cp /etc/default/grub /etc/default/grub.bak
vi /etc/default/grub
写入:
GRUB_CMDLINE_LINUX_DEFAULT="text"
GRUB_TERMINAL=console
执行:
systemctl set-default multi-user.target
11. 安装cuda 10.1
先关闭vnc(重要)
11.1. 驱动安装
去官网下载驱动包
执行
sudo sh NVIDIA-Linux-x86_64-418.116.00
默认安装即可。
11.2. 官网下载安装包
http://developer.nvidia.com/cuda-downloads
到安装包所在目录下运行.run文件,输入accept
sudo sh cuda_10.1.168_418.67_linux.run
按照提示进行安装
安装过程:
之前已经安装了驱动,所以这里不安装driver,等待一会儿安装完成。
记录下安装路径(默认路径 /usr/local/cuda-10.1
)
参考:
https://blog.csdn.net/weixin_30631587/article/details/98026442
https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#ubuntu-installation
12. 安装cudnn for cuda10.1
官网下载cudnn
cudnn-10.1-linux-x64-v7.6.5.32.solitairetheme8
在文件所在路径下执行:
cp cudnn-10.1-linux-x64-v7.6.5.32.solitairetheme8 cudnn-10.1-linux-x64-v7.6.5.32.tgz
tar -zxvf cudnn-10.1-linux-x64-v7.6.5.32.tgz
cp cuda/include/* /usr/local/cuda-10.1/include/
cp cuda/lib64/* /usr/local/cuda-10.1/lib64/
参考:
https://blog.csdn.net/qq_38451119/article/details/85340267
https://docs.nvidia.com/deeplearning/sdk/cudnn-install/
13. 配置cuda10.1环境变量(全局配置)
vi /etc/profile
alias ls='ls --color=auto'
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=$CUDA_HOME/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
然后执行
source /etc/profile
注意:全局配置可选安装,如果普通用户在使用过程中遇到无法使用cuda的问题,请普通用户自己在~/.bashrc
中添加上述export的内容,然后执行source ~/.bashrc
。
14. myadduser设置
建立备份文件夹
mkdir /opt/software/.conf
将vnc 的 xstartup 放在配置文件夹/opt/software/.conf
下
然后执行
sudo vim /usr/sbin/myadduser
写入以下内容:
#create a new user
read -p "Enter fullname you want to create: " username
useradd -m $username
echo "Enter the password for this user: "
passwd $username
chsh -s /bin/bash $username
mkdir /home/$username/.vnc
cp /opt/software/.conf/xstartup /home/$username/.vnc
chown -R $username:$username /home/$username/.vnc
chmod +x /home/$username/.vnc/xstartup
chmod 700 /home/$username
echo "User created successfully..."
然后执行:
sudo chmod 774 /usr/sbin/myadduser
常见问题解决方案
恢复用户
可能某一天,服务器系统盘挂了,需要重新装系统,这时候用户数据还在数据盘里(/home/username
),此时需要进行用户恢复。
和创建用户类似,执行
sudo vim /usr/sbin/myrecuseryUser
写入以下内容:
#recovery a new user
read -p "Enter fullname you want to recovery: " username
useradd -m $username
echo "Enter the password for this user: "
passwd $username
chsh -s /bin/bash $username
# mkdir /home/$username/.vnc
# cp /opt/software/.conf/xstartup /home/$username/.vnc
chown -R $username:$username /home/$username
# chmod +x /home/$username/.vnc/xstartup
# chmod 700 /home/$username
echo "User recoveried successfully..."
然后执行:
sudo chmod 774 /usr/sbin/myrecoveryUser
重装cuda driver
每次开机可能会导致cuda driver挂掉,需要手动进行重装。
#安装前确认没有使用vnc
lsmod | grep nouveau
# 如果没有输出则说明nouveau已经被禁用
sudo service lightdm stop #关闭图形界面 如果安装过程中没有报错可以不执行
sudo sh NVIDIA-Linux-x86_64-430.26.run #安装驱动
#安装提示进行安装,如果出现x-server报错,可能是图形界面没有关闭或者有人使用vnc
modprobe nvidia #挂载
nvidia-smi
桌面图标消失
打开任务管理器(mate system monitor),kill掉caja进程。
如果出现灰屏,可能是端口开多了,将打开的端口关闭