Ubuntu16.04安装和配置GPU版Caffe-ssd流程 (中途各种错误最后完美运行)
笔者用一台新服务器费时两天安装好caffe,以前用旧的服务器安装时由于一些库和配置版本的问题一直失败,这次吸取教训,每一步不确定的地方多检索多百度,另外不同的机器配置和环境可能不同,每一步都有可能不完全符合。终于安好了caffe,友情提示,由于需要修改的源码和安装的库比较多,请每一步务必谨慎,以防最后陷入死循环而很难卸载/还原干净导致心态爆炸。
初始环境: ubuntu 16.04
初始环境 | ubuntu 16.04 x64 |
---|---|
内存 | Intel® Xeon® Silver 4114 CPU @ 2.20GHz × 40 |
GPU | Quadro P4000/PCIe/SSE2 |
显卡驱动 | V384.130 |
cudn | 无 |
cudnn | 无 |
opencv | 系统自带的2.1 |
python | 2.7.12以及3.5.2 |
以下各工具安装版本:
cudn | V9.0.176 |
---|---|
cudnn | V7.5.1 |
opencv | 3.4.3 |
巨人的肩膀:
https://blog.csdn.net/yggaoeecs/article/details/79163789
https://blog.csdn.net/u011974639/article/details/78804299
https://blog.csdn.net/yhaolpz/article/details/71375762
https://www.jianshu.com/p/71bc5f02ecd2
…
一、 安装显卡驱动
笔者的设备出厂自带显卡驱动,这一步可以参考上面几个博客
二、安装CUDA
CUDA是NVIDIA的编程语言平台,想使用GPU就必须要使用cuda。
主要参考:
https://blog.csdn.net/yggaoeecs/article/details/79163789
https://www.jianshu.com/p/71bc5f02ecd2
下载CUDA时一定要注意CUDA和NVIDIA显卡驱动的适配性。
现在的情况是:
CUDA_8.0支持375.及以上系列的显卡驱动;
CUDA_9.0支持384.及以上系列的显卡驱动;
CUDA_9.1支持389.及以上系列的显卡驱动。
1、查询显卡驱动版本:
sudo dpkg --list | grep nvidia-*
本文中的显卡驱动为384.130系列,所以不能下载最新版本的CUDA_9.1,最后下载的是cuda_9.0.176
当然,CUDA_8.0也是没问题的)。
2、验证自己的Linux版本是否支持 CUDA(Ubuntu 16.04没问题)
在终端中输入命令:
uname -m && cat /etc/*release
结果为:
x86_64
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=16.04
DISTRIB_CODENAME=xenial
DISTRIB_DESCRIPTION="Ubuntu 16.04.1 LTS"
NAME="Ubuntu"
VERSION="16.04.1 LTS (Xenial Xerus)"
ID=ubuntu
ID_LIKE=debian
PRETTY_NAME="Ubuntu 16.04.1 LTS"
VERSION_ID="16.04"
HOME_URL="http://www.ubuntu.com/"
SUPPORT_URL="http://help.ubuntu.com/"
BUG_REPORT_URL="http://bugs.launchpad.net/ubuntu/"
UBUNTU_CODENAME=xenial
3、验证系统是否安装了gcc
在终端中输入:gcc --version
结果为:
gcc (Ubuntu 5.4.0-6ubuntu1~16.04.11) 5.4.0 20160609
Copyright (C) 2015 Free Software Foundation, Inc.
This is free software; see the source for copying conditions. There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
若未安装请使用下列命令进行安装:
sudo apt-get install build-essential
4、验证系统是否安装了kernel header和 package development
查看正在运行的系统内核版本,在终端中输入:uname -r
结果显示:4.4.0-31-generic
安装对应kernel版本的kernel header和package development,终端输入:
sudo apt-get install linux-headers-$(uname -r)
结果:
正在读取软件包列表... 完成
正在分析软件包的依赖关系树
正在读取状态信息... 完成
linux-headers-4.4.0-31-generic 已经是最新版 (