在Ubuntu18.04上安装caffe,记录下过程,yibia
安装硬件:Intel i7 +RTX2070
第1步 安装依赖包
在终端输入基本环境必须的依赖包:
sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compile
sudo apt-get install --no-install-recommends libboost-all-dev
sudo apt-get install libopenblas-dev liblapack-dev libatlas-base-dev
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
sudo apt-get install git cmake build-essential
有一定几率安装失败而导致后续步骤出现问题,所以要确保以上依赖包都已安装成功,首先出现安装失败是由于下载源时,运行 sudo apt-get update 后再继续重新运行安装命令,验证是否安装完成。
第2步 禁用 nouveau安装显卡驱动
Ubuntu18.04自带了NVIDIA驱动,但是它没有安装完整,不能在终端使用nvidia-smi命令查看,在之后的CUDA编译测试里面也会出现问题,因此需要重新安装。重新安装的方式如下:
安装好依赖包后需要禁用 nouveau,只有在禁用掉 nouveau 后才能顺利安装 NVIDIA 显卡驱动,禁用方法就是在 /etc/modprobe.d/blacklist.conf 文件中添加一条禁用命令,首先需要打开该文件,通过以下命令打开:
sudo gedit /etc/modprobe.d/blacklist.conf
打开后发写入: blacklist nouveau
保存时命令窗口可能会出现以下提示:
** (gedit:4243): WARNING **: Set document metadata failed:不支持设置属性
无视此提示~,保存后关闭文件,注意此时还需执行以下命令使禁用 nouveau 真正生效:
sudo upate-initramfs -u
1.驱动在线安装方式
进入tty文本模式
ctrl+alt+F1
关闭显示服务
sudo service lightdm stop
卸载原有驱动
sudo apt-get remove --purge nvidia* # 提示有残留可以接 sudo apt autoremove
添加nvidia驱动源
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
寻找适合的驱动版本
ubuntu-drivers devices
(base) li@Fly:~$ ubuntu-drivers devices
== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==
modalias : pci:v000010DEd00001F07sv00001462sd00003732bc03sc00i00
vendor : NVIDIA Corporation
driver : nvidia-driver-410 - third-party free
driver : nvidia-driver-415 - third-party free
driver : nvidia-driver-418 - third-party freUbuntu18.04 caffee
driver : nvidia-driver-430 - third-party free recommended
driver : xserver-xorg-video-nouveau - distro free builtin
安装nvidia driver
sudo apt-get install nvidia-driver-430
检查是否安装成功
nvidia-smi
安装成功启动显示服务
sudo service lightdm start
退出tty模式进入图形界面
ctrl+alt+F7
2.驱动离线安装方式
nvidia官网https://www.nvidia.com/Download/index.aspx?lang=en-us下载显卡对应的驱动NVIDIA-Linux-x86_64-xxx.xx.run,拷贝到Linux某个目录后先改权限
chomod 777 NVIDIA-Linux-x86_64-xxx.xx.run
卸载原有驱动
sudo apt-get remove --purge nvidia* # 提示有残留可以接 sudo apt autoremove
进入tty文本模式
ctrl+alt+F1
临时关闭显示服务
sudo service lightdm stop
运行安装程序
sudo sh ./NVIDIA-Linux-x86_64-xxx.xx.run
安装后再重启显示
sudo service lightdm start
退出tty模式进入图形界面
ctrl+alt+F7
第3步 配置环境变量
同样使用 gedit 命令打开配置文件:
sudo gedit ~/.bashrc
打开后在文件最后加入以下两行内容:
export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
保存退出。
第4步 下载 CUDA 10.1
进入 https://developer.nvidia.com/cuda-downloads ,依次选择 CUDA类型然后下载即可
第3步中已经安装了NVIDIA显卡驱动,故此步骤 CUDA 的安装包括了 nvidia 显卡驱动的安装,此时注意你是否已经安装过 nvidia 显卡驱动。若无法保证已安装的 nvidia 显卡驱动一定正确,那就卸载掉之前安装的 nvidia 显卡驱动(卸载方法链接),然后开始安装 CUDA 10.1;若可以保证已安装正确的 nvidia 显卡驱动,则直接开始安装 CUDA 10.1,在安装过程中选择不再安装 nvidia 显卡驱动。
通过 Ctrl + Alt + F1 进入文本模式,输入帐号密码登录,通过 Ctrl + Alt + F7 可返回图形化模式,在文本模式登录后首先关闭桌面服务:
sudo service lightdm stop
然后通过 Ctrl + Alt + F7 发现已无法成功返回图形化模式,说明桌面服务已成功关闭,注意此步对接下来的 nvidia 驱动安装尤为重要,必需确保桌面服务已关闭。
进入CUDA安装文件路径下,输入:
sudo sh cuda_10.1.168_418.67_linux.run
然后按照提示操作即可,先输入 accept ,然后让选择是否安装 nvidia 驱动,剩下的选择则都输入“y”确认安装或确认默认路径安装,开始安装,此时若出现安装失败提示则可能为未关闭桌面服务或在已安装 nvidia 驱动的情况下重复再次安装 nvidia 驱动,安装完成后输入重启命令重启:
reboot
重启后登录进入系统,可以在/usr/local目录下可以看到cuda和cuda-10.1两个文件夹,表面安装成功。
接下来配置 CUDA 环境变量,与第3步相同,使用 gedit 命令打开配置文件:
sudo gedit ~/.bashrc
在该文件最后加入以下两行并保存:
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
使该配置生效:
source ~/.bashrc
第5步 验证 CUDA 10.1 是否安装成功
分别执行以下命令:
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery
若看到类似以下信息则说明cuda已经安装成功。
第6步 安装 cudnn
登录官网:https://developer.nvidia.com/rdp/cudnn-download ,下载对应 cuda 版本且 linux 系统的 cudnn 压缩包,注意官网下载 cudnn 需要注册帐号并登录。
下载Linux版本完成后,解压
tar zxvf cudnn-10.1-linux-x64-v7.6.1.34.tgz
得到一个 cudn 文件夹,该文件夹下include 和 lib64 两个文件夹,命令行进入 cudn/include 路径下,然后进行以下操作:
sudo cp cudnn.h /usr/local/cuda/include/ #复制头文件
然后命令行进入 cudn/lib64 路径下,运行以下命令:
sudo cp lib* /usr/local/cuda/lib64/ #
复制动态链接库
cd /usr/local/cuda/lib64/sudo rm -rf libcudnn.so libcudnn.so.7 #删除原有动态文件
sudo ln -s libcudnn.so.7.1 libcudnn.so.7 #生成软衔接
sudo ln -s libcudnn.so.7 libcudnn.so #生成软链接
安装完成后可用 nvcc -V 命令验证是否安装成功,若出现以下信息则表示安装成功:
第7步 安装 opencv3.4.6
进入官网 : http://opencv.org/releases.html , 选择 3.4.6 版本的 source , 下载 opencv-3.4.6.zip。
解压到你要安装的位置,命令行进入已解压的文件夹 opencv-3.4.6目录下,执行:
mkdir build #创建编译的文件目录
cd build
cmake -D CMAKE_BUILD_TYPE=Release -D CMAKE_INSTALL_PREFIX=/usr/local ..
make -j8 #
然后编译
编译成功后安装:
sudo make install #安装
安装完成后通过查看 opencv 版本验证是否安装成功:
pkg-config --modversion opencv
第8步 安装Anaconda3
下载安装包
官网下载地址:https://www.anaconda.com/download/#linux
下载Python3.7版本,完成后进入文件目录下:
sudo sh Anaconda3-2019.03-Linux-x86_64.sh
添加环境变量
果在安装Anaconda的过程中没有将安装路径添加到系统环境变量中,需要在安装后手工添加。
sudo gedit ~/.bashrc
在该文件最后加入以下两行并保存:
exportPATH=/home/******/anaconda3/bin:$PATH
使该配置生效:
source ~/.bashrc
然后重新打开终端,输入Python,出现以下界面,表明设置成功。
第9步 安装caffe
首先在你要安装的路径下
clone
源码
git clone https://github.com/BVLC/caffe.git
进入
caffe
,将
Makefile.config.example
文件复制一份并更名为
Makefile.config
,也可以在
caffe
目录下直接调用以下命令完成复制操作 :
sudo cp Makefile.config.example Makefile.config
然后修改
Makefile.config
文件,在
caffe
目录下打开该文件:
sudo gedit Makefile.config
修改
Makefile.config
文件内容:
1.应用 cudnn
将
#USE_CUDNN := 1
修改成:
USE_CUDNN := 1
2.应用 opencv 版本
将
#OPENCV_VERSION := 3
修改为:
OPENCV_VERSION := 3
3.使用 python 接口
将
#WITH_PYTHON_LAYER := 1
修改为
WITH_PYTHON_LAYER := 1
4.修改 python 路径
将Python2环境注销,换成Anaconda3下的Python环境
将PYTHON_LIB:= /usr/lib注释,换成下面
5.修改计算力
根据自己需求修改
6.MakeFile文件修改
将:
NVCCFLAGS +=-ccbin=$(CXX) -Xcompiler-fPIC $(COMMON_FLAGS)
替换为:
NVCCFLAGS += -D_FORCE_INLINES -ccbin=$(CXX) -Xcompiler -fPIC $(COMMON_FLAGS)
将:
LIBRARIES += glog gflags protobuf boost_system boost_filesystem m hdf5_hl hdf5替换为:
LIBRARIES += glog gflags protobuf boost_system boost_filesystem m hdf5_serial_hl hdf5_serial