新系统Ubuntu18.4以上深度工具合集安装(Nvidia+CUDA+Tensorflow+Caffe+Torch)

最新推荐文章于 2022-08-07 11:09:34 发布

NUIST-Haoda

最新推荐文章于 2022-08-07 11:09:34 发布

阅读量812

点赞数

分类专栏： caffe实战 Linux

caffe实战同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

Linux

3 篇文章 0 订阅

订阅专栏

之前在装有caffe的基础上,换CUDA7.5不成功,然后终于找到github上一个教程,一定要按里面的流程安装.把市面上用到的深度工具都装在ubuntu14.04上.现在更新了新系统Ubuntu18.04，显卡还是4路1080Ti，问题贼多，系统装完开机黑屏，无界面，卸载驱动出现循环登录可能，还可能界面鼠标顿卡，记录一下这三天的心塞历程，更新在最后面。有问题请留言.
Basics

1、首选装好系统运行下面的代码:

    sudo apt-get update
    sudo apt-get upgrade
    sudo apt-get install build-essential
    sudo apt-get autoremove

碰到的问题：https://linux.cn/article-3874-1.html

问题：我试着通过运行apt-get update命令来再次同步包索引文件，但是却出现了“404 无法找到”的错误，看起来似乎是我不能从先前添加的第三方PPA仓库中获取最新的索引。我怎样才能清除这些破损而且陈旧的PPA仓库呢？

Err http://ppa.launchpad.net trusty/main amd64 Packages
404 Not Found
Err http://ppa.launchpad.net trusty/main i386 Packages
404 Not Found
W: Failed to fetch http://ppa.launchpad.net/finalterm/daily/ubuntu/dists/trusty/main/binary-amd64/Packages 404 Not Found

W: Failed to fetch http://ppa.launchpad.net/finalterm/daily/ubuntu/dists/trusty/main/binary-i386/Packages 404 Not Found

E: Some index files failed to download. They have been ignored, or old ones used instead.

当你试着更新APT包索引时，“404 无法找到”错误总是会在版本更新之后发生。就是说，在你升级你的Ubuntu发行版后，你在旧的版本上添加的一些第三方PPA仓库就不再受新版本的支持。在此种情况下，你可以像下面这样来鉴别并清除那些破损的PPA仓库。

首先，找出那些引起“404 无法找到”错误的PPA。

$ sudo apt-get update|grep"Failed"

$ sudo add-apt-repository--remove ppa:finalterm/daily

你得去重复重复再重复，把上面找到的所有过时的PPA仓库一个一个地移除。

如果在GUI中删除的话，https://itsfoss.com/how-to-remove-or-delete-ppas-quick-tip/

这样就解决了。

2、安装git

sudo apt-get install git

Nvidia Drivers

1、找机子的显卡

lspci | grep -i nvidia

2、自己下载Nvidia-352.41.run或在线安装

    sudo add-apt-repository ppa:graphics-drivers/ppa
    sudo apt-get update
    sudo apt-get install nvidia-352

3、重启

sudo shutdown -r now

4、nvidia检查

cat /proc/driver/nvidia/version

CUDA

1、下载CUDA7.5

    sudo dpkg -i cuda-repo-ubuntu1404*amd64.deb
    sudo apt-get update
    sudo apt-get install cuda

2、添加CUDA环境

    echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
    echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
    source ~/.bashrc

3、检查CUDA版本

nvcc -V

4、重启

sudo shutdown -r now

Checking your CUDA Installation (Optional)

1、编译cuda的sample:

    /usr/local/cuda/bin/cuda-install-samples-7.5.sh ~/cuda-samples
    cd ~/cuda-samples/NVIDIA*Samples
    make -j $(($(nproc) + 1))

2、查看显卡里面的信息

bin/x86_64/linux/release/deviceQuery

Check

1、终端查看

nvidia-smi

Tensorflow

1、先下载v0.8版的GPU支持

sudo apt-get install python-pip python-dev

2、如果中途安装不了可以先下载那个网址东西，下载好了，然后安装，中途会有几个包的numpy、six、protobuf、wheel下载安装比较慢或者下载不了，可以单独安装。

sudo pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-0.8.0-cp27-none-linux_x86_64.whl

3、测试Tensorflow

    python
    >>> import tensorflow as tf
    >>> exit()

4、我碰到的一个问题"AttributeError: NewBase is_abstract, ImportError: libcudart.so.7.5"

解决：是因为six版本问题。

$sudo pip install six --upgrade --target="/usr/lib/python2.7/dist-packages"

5、推荐IDE调试工具

pyCharm免费的社区版（community release）不支持远程调试，百度下载然后到bin里面，运行pycharm安装文件就可以了。
OpenBLAS

1、先下载git，然后安装OpenBLAS

    mkdir ~/git
    cd ~/git
    git clone https://github.com/xianyi/OpenBLAS.git
    cd OpenBLAS
    sudo apt-get install gfortran
    make FC=gfortran -j $(($(nproc) + 1))
    sudo make PREFIX=/usr/local install

2、添加lib库的变量路径

echo 'export LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH' >> ~/.bashrc

Common Tools

1、安装来自Scipy的普通tools

sudo apt-get install -y libfreetype6-dev libpng12-dev
pip install -U matplotlib ipython[all] jupyter pandas scikit-image

2、如果安装matplotlib时无法安装，按照下面方法：

先下载:here

然后减压matplotlib-1.5.0，并进入matplotlib-1.5.0里面

最后运行

python setup.py build
python setup.py install

OpenCV

我安装的opencv版本是2.4.10，因为CUDA版本比较新，所以opencv版本不能太新，3.x的编译不支持（已测试）。编译中途出现的问题：

issue:

nvcc fatal : Unsupported gpu architecture 'compute_11'
CMake Error at cuda_compile_generated_matrix_operations.cu.o.cmake:206 (message):
Error generating
/home/smie/Documents/opencv2.4.11/build/modules/core/CMakeFiles/cuda_compile.dir/__/dynamicuda/src/cuda/./cuda_compile_gene

rated_matrix_operations.cu.o
make[2]: ***
[modules/core/CMakeFiles/cuda_compile.dir/__/dynamicuda/src/cuda/./cuda_compile_generated_matrix_operations.cu.o] Error 1
make[1]: *** [modules/core/CMakeFiles/opencv_core.dir/all] Error 2 make[1]: *** Waiting for unfinished jobs....

solution:

cmake -D BUILD_opencv_gpu=OFF -D WITH_CUDA=OFF -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local -D CUDA_GENERATION=Kepler -D WITH_TBB=ON -D BUILD_NEW_PYTHON_SUPPORT=ON -D WITH_V4L=ON -D INSTALL_C_EXAMPLES=ON -D INSTALL_PYTHON_EXAMPLES=ON -D BUILD_EXAMPLES=ON -D WITH_QT=OFF -D WITH_OPENGL=ON -D BUILD_TIFF=ON ..

基本其他问题就简单了。

近期opencv3.4版本的更新了，又尝试了一下新的Ubuntu18.4+opencv3.4组合，发现Ubuntu界面改善了很多，用起来也很方便，在安装opencv3.4的时候遇到好多坑，继续填坑。

首先是安装opencv3.4，然后遇到ippicv的坑，下不下来，只能手动下载之后再拷贝，重新make。

链接参考：

https://blog.csdn.net/neilooo/article/details/78425559

https://github.com/opencv/opencv_3rdparty/tree/ippicv/master_20170822

其次就是编译caffe的坑，hdf5的报错。

链接参考：

http://www.cnblogs.com/xiangfeidemengzhu/p/7058391.html

https://blog.csdn.net/striker_v/article/details/51615197

这个问题就解决了。
Caffe

1、caffe相信大家都很熟悉了，下面是一些基础依赖库

    sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
    sudo apt-get install --no-install-recommends libboost-all-dev
    sudo apt-get install python-skimage ipython python-pil python-h5py ipython python-gflags python-yaml
    sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev

2、克隆caffe

    cd ~/git
    git clone https://github.com/BVLC/caffe.git
    cd caffe
    cp Makefile.config.example Makefile.config

3、如果安装了cuDNN然后把Makefile文件的USE_CUDNN := 1注释去掉

sed -i 's/# USE_CUDNN := 1/USE_CUDNN := 1/' Makefile.config

4、如果安装了OpenBLAS，修改BLAS参数

sed -i 's/BLAS := atlas/BLAS := open/' Makefile.config

5、安装需求build和测试caffe，编译PyCaffe

    sudo pip install -r python/requirements.txt
    make all -j $(($(nproc) + 1))
    make test -j $(($(nproc) + 1))
    make runtest -j $(($(nproc) + 1))
    make pycaffe -j $(($(nproc) + 1))

6、添加caffe的环境变量

    echo 'export CAFFE_ROOT=$(pwd)' >> ~/.bashrc
    echo 'export PYTHONPATH=$CAFFE_ROOT/python:$PYTHONPATH' >> ~/.bashrc
    source ~/.bashrc

7、测试caffe接口

    ipython
    >>> import caffe
    >>> exit()

Torch

1、这个是facebook的深度框架

    git clone https://github.com/torch/distro.git ~/git/torch --recursive
    cd torch; bash install-deps;
    ./install.sh

2、添加环境变量

source ~/.bashrc

3、推荐IDE工具eclipse，安装相应的插件(Lua Development Tools)

首先安装eclipse c/c++的开发版，然后在官网搜索Lua，看到LDT就点进去，找到Existing Eclipse installation，按照官网指示安装插件，就ok了。

------------------------------------------------------------更新线--------------------------------------------------------------------

机器Super Workstation7048GR-TR + Ubuntu18.04+ 4路NVIDIA 1080Ti装机问题记录：

机器若果停留在两种状态下：

第一种状态：已经装过系统和显卡驱动之后，但是停留在卡死黑屏(VGA有信号输出，无显卡信号输出)。如电脑有驱动需要卸载(中途卸载重新安装之后如果出现循环登录的话，是因为界面用户权限不够导致循环登录。可以尝试给用户超级权限，可以解决循环登录)

卸载驱动操作

sudo apt-get autoremove --purge nvidia-*

1、切换到tty2，(ctrl+alt+f2切换到控制台，sudo su提升到root权限)

2、然后操作下面的命令(针对18.04版的系统或后面的版本)

    lsmod | grep nouveau

    sudo vim /etc/modprobe.d/blacklist-nouveau.conf

    //添加两行
    blacklist nouveau
    options nouveau modeset=0

    //重启
    reboot

    //重启完后再执行
    lsmod | grep nouveau

    //Ubuntu18.04禁掉界面
    sudo systemctl set-default multi-user.target

    //安装单独的显卡驱动,提示是否升级X config配置文件选择no,否则没桌面
    ./NVIDIA-Linux-x86_64-384.90.run --no-opengl-files

    //装完后驱动执行下
    nvidia-smi

    //如果正常，启用桌面
    sudo systemctl set-default graphical.target

    //最后执行
    nvidia-smi -pm 1

    //操作完然后
    reboot
    //然后就ok啦,咚出现了可爱的Ubuntu啦

第二种状态，就是新系统状态

    lsmod | grep nouveau

    sudo gedit /etc/modprobe.d/blacklist-nouveau.conf

    //添加两行
    blacklist nouveau
    options nouveau modeset=0

    //重启
    reboot

    //重启完后再执行
    lsmod | grep nouveau

    //Ubuntu18.04禁掉界面
    sudo systemctl set-default multi-user.target

    //安装单独的显卡驱动,提示是否升级X config配置文件选择no,否则没桌面，驱动什么版本都可以
    ./NVIDIA-Linux-x86_64-384.90.run --no-opengl-files

    //装完后驱动执行下
    nvidia-smi

    //如果正常，启用桌面
    sudo systemctl set-default graphical.target

    //最后执行
    nvidia-smi -pm 1

    //操作完然后
    reboot
    //然后就ok啦,咚出现了可爱的Ubuntu啦

如有需要主板bios的问题，可以去官网下载相应的升级包。

其他系统出现这个问题，可以尝试下面教程(有的系统没有亲测)

操作如下：

    1、ctrl+alt+f2切换到控制台，sudo su提升到root权限

    2、nvidia-uninstall #卸载原来的驱动

    3、/etc/init.d/lightdm stop #禁用桌面

    4、./NVIDIA-Linux-x86_64-384.90.run --no-opengl-files #安装单独的显卡驱动，不安装opengl因为可能会影响桌面，提示是否升级X config配置文件如果是独显做输出就选yes，如果是用集显做显示输出就默认选no，其他都默认。注：显卡驱动文件一般在/home/soft/下或者是/home/lthpc/soft/下面

    5、/etc/init.d/lightdm start #启动桌面进程，或者直接reboot重启一下

    nvidia-smi -pm 1 #开启卡的Persistence模式

如果还有出现其他问题，请留言。

如果是电脑主板比较简单的机子可以按照简易教程按照，链接如下：

https://linuxconfig.org/how-to-install-the-nvidia-drivers-on-ubuntu-18-04-bionic-beaver-linux

一位网友翻译版：

https://blog.csdn.net/tjuyanming/article/details/80862290
---------------------
作者：langb2014
来源：CSDN
原文：https://blog.csdn.net/langb2014/article/details/51579491
版权声明：本文为博主原创文章，转载请附上博文链接！

NUIST-Haoda

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
新系统Ubuntu18.4以上深度工具合集安装(Nvidia+CUDA+Tensorflow+Caffe+Torch)

之前在装有caffe的基础上,换CUDA7.5不成功,然后终于找到github上一个教程,一定要按里面的流程安装.把市面上用到的深度工具都装在ubuntu14.04上.现在更新了新系统Ubuntu18.04，显卡还是4路1080Ti，问题贼多，系统装完开机黑屏，无界面，卸载驱动出现循环登录可能，还可能界面鼠标顿卡，记录一下这三天的心塞历程，更新在最后面。有问题请留言.Basics1、首选装好...
复制链接

扫一扫