新系统Ubuntu18.4以上深度工具合集安装(Nvidia+CUDA+Tensorflow+Caffe+Torch)

之前在装有caffe的基础上,换CUDA7.5不成功,然后终于找到github上一个教程,一定要按里面的流程安装.把市面上用到的深度工具都装在ubuntu14.04上.现在更新了新系统Ubuntu18.04,显卡还是4路1080Ti,问题贼多,系统装完开机黑屏,无界面,卸载驱动出现循环登录可能,还可能界面鼠标顿卡,记录一下这三天的心塞历程,更新在最后面。有问题请留言.
Basics

1、首选装好系统运行下面的代码:

    sudo apt-get update  
    sudo apt-get upgrade  
    sudo apt-get install build-essential  
    sudo apt-get autoremove

碰到的问题:https://linux.cn/article-3874-1.html

问题:我试着通过运行apt-get update命令来再次同步包索引文件,但是却出现了“404 无法找到”的错误,看起来似乎是我不能从先前添加的第三方PPA仓库中获取最新的索引。我怎样才能清除这些破损而且陈旧的PPA仓库呢?

Err http://ppa.launchpad.net trusty/main amd64 Packages
  404  Not Found
Err http://ppa.launchpad.net trusty/main i386 Packages
  404  Not Found
W: Failed to fetch http://ppa.launchpad.net/finalterm/daily/ubuntu/dists/trusty/main/binary-amd64/Packages  404  Not Found

W: Failed to fetch http://ppa.launchpad.net/finalterm/daily/ubuntu/dists/trusty/main/binary-i386/Packages  404  Not Found

E: Some index files failed to download. They have been ignored, or old ones used instead.

当你试着更新APT包索引时,“404 无法找到”错误总是会在版本更新之后发生。就是说,在你升级你的Ubuntu发行版后,你在旧的版本上添加的一些第三方PPA仓库就不再受新版本的支持。在此种情况下,你可以像下面这样来鉴别并清除那些破损的PPA仓库。

首先,找出那些引起“404 无法找到”错误的PPA。

$ sudo apt-get update|grep"Failed"

$ sudo add-apt-repository--remove ppa:finalterm/daily

你得去重复重复再重复,把上面找到的所有过时的PPA仓库一个一个地移除。

如果在GUI中删除的话,https://itsfoss.com/how-to-remove-or-delete-ppas-quick-tip/

这样就解决了。

2、安装git

sudo apt-get install git

Nvidia Drivers

1、找机子的显卡

lspci | grep -i nvidia

2、自己下载Nvidia-352.41.run或在线安装

    sudo add-apt-repository ppa:graphics-drivers/ppa
    sudo apt-get update
    sudo apt-get install nvidia-352

3、重启

sudo shutdown -r now

4、nvidia检查

cat /proc/driver/nvidia/version

CUDA

1、下载CUDA7.5

    sudo dpkg -i cuda-repo-ubuntu1404*amd64.deb
    sudo apt-get update
    sudo apt-get install cuda

2、添加CUDA环境

    echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
    echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
    source ~/.bashrc

3、检查CUDA版本

nvcc -V

4、重启

sudo shutdown -r now

Checking your CUDA Installation (Optional)

1、编译cuda的sample:

    /usr/local/cuda/bin/cuda-install-samples-7.5.sh ~/cuda-samples
    cd ~/cuda-samples/NVIDIA*Samples
    make -j $(($(nproc) + 1))

2、查看显卡里面的信息

bin/x86_64/linux/release/deviceQuery

Check

1、终端查看

 nvidia-smi

Tensorflow

1、先下载v0.8版的GPU支持

sudo apt-get install python-pip python-dev

2、如果中途安装不了可以先下载那个网址东西,下载好了,然后安装,中途会有几个包的numpy、six、protobuf、wheel下载安装比较慢或者下载不了,可以单独安装。

sudo pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-0.8.0-cp27-none-linux_x86_64.whl

3、测试Tensorflow

    python
    >>> import tensorflow as tf
    >>> exit()

4、我碰到的一个问题"AttributeError: NewBase is_abstract, ImportError: libcudart.so.7.5"

解决:是因为six版本问题。

$sudo pip install six --upgrade --target="/usr/lib/python2.7/dist-packages"

5、推荐IDE调试工具

pyCharm免费的社区版(community release)不支持远程调试,百度下载然后到bin里面,运行pycharm安装文件就可以了。
OpenBLAS

1、先下载git,然后安装OpenBLAS

    mkdir ~/git
    cd ~/git
    git clone https://github.com/xianyi/OpenBLAS.git
    cd OpenBLAS
    sudo apt-get install gfortran
    make FC=gfortran -j $(($(nproc) + 1))
    sudo make PREFIX=/usr/local install

2、添加lib库的变量路径

echo 'export LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH' >> ~/.bashrc

Common Tools

1、安装来自Scipy的普通tools

    sudo apt-get install -y libfreetype6-dev libpng12-dev
    pip install -U matplotlib ipython[all] jupyter pandas scikit-image

2、如果安装matplotlib时无法安装,按照下面方法:

先下载:here

然后减压matplotlib-1.5.0,并进入matplotlib-1.5.0里面

最后运行

    python setup.py build
    python setup.py install

OpenCV

我安装的opencv版本是2.4.10,因为CUDA版本比较新,所以opencv版本不能太新,3.x的编译不支持(已测试)。编译中途出现的问题:

issue:

nvcc fatal   : Unsupported gpu architecture 'compute_11'
CMake Error at cuda_compile_generated_matrix_operations.cu.o.cmake:206 (message):
  Error generating
/home/smie/Documents/opencv2.4.11/build/modules/core/CMakeFiles/cuda_compile.dir/__/dynamicuda/src/cuda/./cuda_compile_gene

rated_matrix_operations.cu.o
make[2]: ***
[modules/core/CMakeFiles/cuda_compile.dir/__/dynamicuda/src/cuda/./cuda_compile_generated_matrix_operations.cu.o] Error 1
make[1]: *** [modules/core/CMakeFiles/opencv_core.dir/all] Error 2 make[1]: *** Waiting for unfinished jobs....

solution:

cmake -D BUILD_opencv_gpu=OFF -D WITH_CUDA=OFF -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local -D CUDA_GENERATION=Kepler -D WITH_TBB=ON -D BUILD_NEW_PYTHON_SUPPORT=ON -D WITH_V4L=ON -D INSTALL_C_EXAMPLES=ON -D INSTALL_PYTHON_EXAMPLES=ON -D BUILD_EXAMPLES=ON -D WITH_QT=OFF -D WITH_OPENGL=ON -D BUILD_TIFF=ON ..

基本其他问题就简单了。

近期opencv3.4版本的更新了,又尝试了一下新的Ubuntu18.4+opencv3.4组合,发现Ubuntu界面改善了很多,用起来也很方便,在安装opencv3.4的时候遇到好多坑,继续填坑。

首先是安装opencv3.4,然后遇到ippicv的坑,下不下来,只能手动下载之后再拷贝,重新make。

链接参考:

https://blog.csdn.net/neilooo/article/details/78425559

https://github.com/opencv/opencv_3rdparty/tree/ippicv/master_20170822

其次就是编译caffe的坑,hdf5的报错。

链接参考:

http://www.cnblogs.com/xiangfeidemengzhu/p/7058391.html

https://blog.csdn.net/striker_v/article/details/51615197

这个问题就解决了。
Caffe

1、caffe相信大家都很熟悉了,下面是一些基础依赖库

    sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
    sudo apt-get install --no-install-recommends libboost-all-dev
    sudo apt-get install python-skimage ipython python-pil python-h5py ipython python-gflags python-yaml
    sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev

2、克隆caffe

    cd ~/git
    git clone https://github.com/BVLC/caffe.git
    cd caffe
    cp Makefile.config.example Makefile.config

3、如果安装了cuDNN然后把Makefile文件的USE_CUDNN := 1注释去掉

sed -i 's/# USE_CUDNN := 1/USE_CUDNN := 1/' Makefile.config

4、如果安装了OpenBLAS,修改BLAS参数

sed -i 's/BLAS := atlas/BLAS := open/' Makefile.config

5、安装需求build和测试caffe,编译PyCaffe

    sudo pip install -r python/requirements.txt
    make all -j $(($(nproc) + 1))
    make test -j $(($(nproc) + 1))
    make runtest -j $(($(nproc) + 1))
    make pycaffe -j $(($(nproc) + 1))

6、添加caffe的环境变量

    echo 'export CAFFE_ROOT=$(pwd)' >> ~/.bashrc
    echo 'export PYTHONPATH=$CAFFE_ROOT/python:$PYTHONPATH' >> ~/.bashrc
    source ~/.bashrc

7、测试caffe接口

    ipython
    >>> import caffe
    >>> exit()

Torch

1、这个是facebook的深度框架

    git clone https://github.com/torch/distro.git ~/git/torch --recursive
    cd torch; bash install-deps;
    ./install.sh

2、添加环境变量

source ~/.bashrc

3、推荐IDE工具eclipse,安装相应的插件(Lua Development Tools)

首先安装eclipse c/c++的开发版,然后在官网搜索Lua,看到LDT就点进去,找到Existing Eclipse installation,按照官网指示安装插件,就ok了。

------------------------------------------------------------更新线--------------------------------------------------------------------

机器Super Workstation7048GR-TR + Ubuntu18.04+ 4路NVIDIA 1080Ti装机问题记录:

机器若果停留在两种状态下:

第一种状态:已经装过系统和显卡驱动之后,但是停留在卡死黑屏(VGA有信号输出,无显卡信号输出)。如电脑有驱动需要卸载(中途卸载重新安装之后如果出现循环登录的话,是因为界面用户权限不够导致循环登录。可以尝试给用户超级权限,可以解决循环登录)

卸载驱动操作

sudo apt-get autoremove --purge nvidia-*

1、切换到tty2,(ctrl+alt+f2切换到控制台,sudo su提升到root权限)

2、然后操作下面的命令(针对18.04版的系统或后面的版本)

    lsmod | grep nouveau
     
    sudo vim /etc/modprobe.d/blacklist-nouveau.conf
     
    //添加两行
    blacklist nouveau
    options nouveau modeset=0
     
    //重启
    reboot
     
    //重启完后再执行
    lsmod | grep nouveau
     
    //Ubuntu18.04禁掉界面
    sudo systemctl set-default multi-user.target
     
    //安装单独的显卡驱动,提示是否升级X config配置文件选择no,否则没桌面
    ./NVIDIA-Linux-x86_64-384.90.run --no-opengl-files
     
    //装完后驱动执行下
    nvidia-smi
     
    //如果正常,启用桌面
    sudo systemctl set-default graphical.target
     
    //最后执行
    nvidia-smi -pm 1
     
    //操作完然后
    reboot
    //然后就ok啦,咚出现了可爱的Ubuntu啦

第二种状态,就是新系统状态

    lsmod | grep nouveau
     
    sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
     
    //添加两行
    blacklist nouveau
    options nouveau modeset=0
     
    //重启
    reboot
     
    //重启完后再执行
    lsmod | grep nouveau
     
    //Ubuntu18.04禁掉界面
    sudo systemctl set-default multi-user.target
     
    //安装单独的显卡驱动,提示是否升级X config配置文件选择no,否则没桌面,驱动什么版本都可以
    ./NVIDIA-Linux-x86_64-384.90.run --no-opengl-files
     
    //装完后驱动执行下
    nvidia-smi
     
    //如果正常,启用桌面
    sudo systemctl set-default graphical.target
     
    //最后执行
    nvidia-smi -pm 1
     
    //操作完然后
    reboot
    //然后就ok啦,咚出现了可爱的Ubuntu啦

如有需要主板bios的问题,可以去官网下载相应的升级包。

其他系统出现这个问题,可以尝试下面教程(有的系统没有亲测)

操作如下:

    1、ctrl+alt+f2切换到控制台,sudo su提升到root权限
     
    2、nvidia-uninstall #卸载原来的驱动
     
    3、/etc/init.d/lightdm stop #禁用桌面
     
    4、./NVIDIA-Linux-x86_64-384.90.run --no-opengl-files #安装单独的显卡驱动,不安装opengl因为可能会影响桌面,提示是否升级X config配置文件如果是独显做输出就选yes,如果是用集显做显示输出就默认选no,其他都默认。注:显卡驱动文件一般在/home/soft/下或者是/home/lthpc/soft/下面
     
    5、/etc/init.d/lightdm start #启动桌面进程,或者直接reboot重启一下
     
    nvidia-smi -pm 1 #开启卡的Persistence模式

如果还有出现其他问题,请留言。

如果是电脑主板比较简单的机子可以按照简易教程按照,链接如下:

https://linuxconfig.org/how-to-install-the-nvidia-drivers-on-ubuntu-18-04-bionic-beaver-linux

一位网友翻译版:

https://blog.csdn.net/tjuyanming/article/details/80862290
---------------------  
作者:langb2014  
来源:CSDN  
原文:https://blog.csdn.net/langb2014/article/details/51579491  
版权声明:本文为博主原创文章,转载请附上博文链接!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值