微星GT80S win8+ubuntu16.04.01+theano+tensorflow+cuda8.0深度学习平台搭建

配置了快一个月的电脑,这个GT80S真是不好弄,该遇到的问题基本全都有,下面做个记录:

           之前在装系统的时候经常遇到卡死在装机界面中的问题(其他正常的电脑都可以只有这个微星不行),最后才知道是ubuntu系统版本的问题,试过ubuntu14.04.04,14.04.03,15.04.01,16.04系统都卡死在装机界面,只有ubuntu14.02,ubuntu16.04.01可以正常装机,但是14.02还有一个问题就是进入系统后网卡识别不了,没有eth0,推荐ubuntu16.04.01麒麟版,好看支持多,重要的是cuda主要支持14.04,15.04,16.04 so no zuo no die。对了还有一个问题就是上述能装的版本还有一个问题有一个问题是装好之后第一次引导可以正常,重启之后就找不到引导启动不了,下面一一解决:

1.linux安装:【点击下载:ubuntu16.04.01(官网),UltralSO9

   1.1)下载ubuntu16.04.01,UltraISO9软件(中文版:A06C-83A7-701D-6CFC  用户名:Guanjiu),制作Linux U盘启动项,启动Linux安装

    1.2)   安装完成后进入ubuntu16 第一次一般是可以正常进入的,如果没有ubuntu的启动项,进入win8 下载EasyBCD2.3添加一个启动项,进入之后,先不着急配置。重启ubuntu,如果可以正常进入那恭喜,没有引导问题,如果有显示黑屏,或者进入了Grub中参照一下解决方法:

     1.3)黑屏(这台80S就是这种情况):如果黑屏进不去,进入win8 重新使用EasyBCD制作引导,注意选择Type:为Grub 2 ,为的是可以先进入Grub中,一般想直接重新进入Linux是不可能的了, 系 统会找不到linux的启动文件。

    1.4)Grub:进入了Grub中按一下方法操作

(参考:http://zhidao.baidu.com/link?url=lcrniVHm2Wwtj1UDv90vGjmanuLYDo7XkOk7XGU_y0jnGmxrHta1geVi57kvPozCOt-H460mTFr7LtbAkIAeTa):

              #进入grub>: ls   (罗列所有磁盘信息)

              #安装系统时:

                 如果/boot没有单独分区,用以下命令:

                 #grub>: ls (hd0,X)/boot/grub

                 /boot单独分区,则用下列命令:

                 #grub>:ls (hd0,X)/grub

                #去找一个类似或者相同文件名的启动文件: normal.mod 文件,

             (实在找不到使用引导盘启动一个系统,进入之前的系统/boot/grub/里面去找,确定位置后,在进入这里)找到对应路径后:

                #将grub的两部分关联起来:  

                # grub>set root=(hd0,5)(boot所在的盘符)

                #grub>set prefix=(hd0,5)/boot/grub/i386-pc/

                 ( 配置刚找到的路径,有可能在grub路径下还有文件夹里面才有normal***例如我的在/boot/grub/i386-pc/

                #grub>insmod /boot/grub/i386-pc/normal.mod(这个就直接指向你找到的文件normal***)

                #启动系统:

                #grub>normal(临时启动,下次还是会出现grub引导,除非你每次输入对应的应导)

                #进入系统后:

                #sudo update-grub 

                #sudo grub-install /dev/sdasda是你的安装的硬盘号码,千万不要指定分区号码,例如sda1,sda5等都不)

                 #重启测试是否已经恢复了grub的启动菜单? 如果没有,参照其他教程安装grub启动项

                 #另外如果出现的是grub rescue> 参考:(http://jingyan.baidu.com/article/c85b7a640cd7d6003bac95f8.html)

                 grub rescue> set root=(hd0,msdos13)/boot/grub

                 grub rescue> set prefix=(hd0,msdos13)/boot/grub

                 grub rescue> insmod normal

                 grub rescue> normal

                 然后进入系统在安装grub

                 #下图就是成功启动后的系统:

       

 2.安装cuda8.0(参考:http://blog.csdn.net/zhouqingtaostudy/article/details/50896948

    2.1)降低GCC G++版本到GCC5.4(参考:http://huaonline.iteye.com/blog/2055975)

           ---下载对应版本的gcc g++(这里只是以4.8为例,如果之后安装任提示版本高降到你想要的版本即可)----

            sudo apt-get install gcc-4.8

            sudo apt-get install g++-4.8

           配置系统的编译器(后面的40 是优先权应该是,只要配置的比系统的高就行,如果运行完系统的编译器版本没有改变就往高配置一下就行)

           sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.8 40

           sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.8 40

         #查看gcc ,g++版本

            #gcc  -v

           #g++  -v

       

    2.2 )安装驱动(GTX1080、GTX1070、GTX980)注:可先在ubuntu 系统的附加驱动中查找一下有没有对应驱动,例如GTX 980 的驱动

           #下载对应显卡型号驱动:http://www.nvidia.cn/Download/index.aspx?lang=cn

           #安装nvidia驱动所需的头文件:sudo apt-get install linux-headers - 'uname-r'

           #按下 Ctrl+Alt+F1(1-6)

           #关GDM:sudo /etc/init.d/lightdm stop or sudo /etc/init.d/gdm stop

           #安装:sudo sh nvidia*****.run

           #重启GDM: sudo /etc/init.d/lightdm restart

           #sudo reboot

           #输入: nvidia-smi 查看对应驱动是否已经装好,有没有识别到显卡型号(没有可以尝试:sudo apt-get install mesa-utils)

           ------------备用命令-----------

 #参考:http://www.cnblogs.com/platero/p/4070756.html

     #删除原驱动:sudo apt-get --purge remove nvidia-*

              #安装好后使用:nvidia-smi查看

         

    2.3)安装cuda8.0  [注:GTX 1070 以上支持cuda 8.0](参考之前写的:http://blog.csdn.net/dakarli/article/details/52054042)

          #按下 Ctrl+Alt+F1(1-6)

           #关GDM:sudo /etc/init.d/lightdm stop or sudo /etc/init.d/gdm stop

           #安装:sudo sh ./cuda_8.0 ****.run (注意这里不要安装里面的驱动程序,安装tooltik就能用了)

           #重启GDM: sudo /etc/init.d/lightdm restart   

    
    #设置环境变量(或者手动修改添加进 ./bashrc就行)#设置环境变量(或者手动修改添加进 ./bashrc就行)

    echo 'export PATH=/usr/local/cuda-8.0/bin:$PATH' >> ~/.bashrc

    echo 'export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc

    source ~/.bashrc

    2.4)  安装cudnn (参考之前写的:http://blog.csdn.net/dakarli/article/details/52054042)

   

3.安装theano(参考之前写的:http://blog.csdn.net/dakarli/article/details/52054042


4.安装tensorflow(参考:http://wiki.jikexueyuan.com/project/tensorflow-zh/get_started/os_setup.html)

                                     (现在仅支持cuda7.5,按源码安装选择8.0好像也不行)

    4.1)#Ubuntu/Linux 64-bit, GPU enabled, Python 2.7. Requires CUDA toolkit 7.5 and CuDNN v4.

       pip install --ignore-installed --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-0.8.0rc0-cp27-none-linux_x86_64.whl

   4.2)可能会遇到的问题

     #报出没有    libcudart.so.7.5 问题:

        ImportError: libcurand.so.7.5: cannot open shared object file: No such file or directory

     #解决办法:复制cuda7.5的库(libcurand.so.7.5)到/usr/local/cuda/lib64/【这个不是好的解决办法,我主要是用的theano如果你用tensorflow建议安装cuda7.5或者等tensorflow cuda8.0的版本】


     #---------------------------------------------------------------------------------------

    #error:
  1. You are using pip version 8.1.1, however version 8.1.2 is available.  
  2. You should consider upgrading via the 'pip install --upgrade pip' command.

     #解决办法:pip升级参考:( http://blog.csdn.net/qq_28616685/article/details/51374534)

        #软链接建立方法:

         ln -s /usr/local/python3/bin/easy_install-3.5 /usr/bin/easy_install

         ln -s /usr/local/python3/bin/pip3 /usr/bin/pip

        # pip只要切换到easy_install-3.5目录下:easy_install-3.5 pip==8.1.2

     #error:

       >>> import tensorflow as tf

      Traceback (most recent call last):

       File "<stdin>", line 1, in <module>

       File "tensorflow/__init__.py", line 23, in <module>

            from tensorflow.python import *

        File "tensorflow/python/__init__.py", line 48, in <module>

        from tensorflow.python import pywrap_tensorflow

       ImportError: cannot import name pywrap_tensorflow

       python误以为tensorflow目录中的tensorflow就是要导入的模块。

     #解决办法,不要在tensorflow中运行python或者ipython

     #其他综合问题、安装步骤写见:https://www.douban.com/note/568373446/

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值