【ubuntu】安装Mask_RCNN相关包及安装CUDA9.0, cudnn7.0
dockerXShell
😄 😆 😊 😃 😏 😍 😘 😚 😳 😌 😆 😁 😉 😜 😝 😀 😗 😙 😛 😴 😟 😦 😧 😮 😬 😕 😯 😑 😒 😅 😓 😥 😩 😔 😞 😖 😨 😰 😣 😢 😭 😂 😲 😱
更新:发现实验室新的RTX 3090x 不能用CUDA9.0,要用CUDA11.1,我晕orz
RTX3090等新显卡想使用tf1.15等可参考《无需源码编译 | 基于RTX3090配置tensorflow1.15环境》
注意:先检查当前python版本,最好使用3.6版本,最新的许多包无法适用最新的python3.8版本。出现
AttributeError: module ‘platform‘ has no attribute ‘linux_distribution‘
报错。
可使用which python
查看当前python安装位置,使用whereis python
查看所有python安装位置。
使用python --version
查看python版本。
若已经是3.6版本可直接进行下一步安装,否则可使用conda创建新的环境。其中py2是你的新的python3.6环境的名称。
conda create -n py2 anaconda python=3.6
进入该环境:
conda activate py2
离开该环境:
conda deactivate
1. 安装相应包
依据requirements.txt
中记录的库的版本进行安装。
pip install -r requirements.txt
2. 尝试运行代码
python face.py
当然如果直接就能够运行就不用往下看了,不过可能会出现报错:
ImportError: libSM.so.6: cannot open shared object file: No such file or dir
解决方法:
apt-get install libsm6
如果你出现了上面的错误,那你很大概率也会遇到下面的问题:
ImportError: libXrender.so.1: cannot open shared object file: No such file or directory
解决方法:
apt-get install libxrender1
类似的:ImportError: libXext.so.6: cannot open shared object file: No such file or directory
解决方法:
apt-get install libxext-dev
但出现ImportError: libcublas.so.9.0: cannot open shared object file: No such file
说明CUDA版本不对或没装CUDA。查看下版本信息(虽然好像cuda11.1就没有这个version.txt,但可以直接在/usr/local/中看到文件夹名为cuda-11.1):
cat /usr/local/cuda/version.txt
参考该博客,检查tensorflow-gpu与cuda、cudnn的版本对应表
3. 安装CUDA9.0
3.1 下载cuda9.0安装包
进入官网https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal获取下载链接:https://developer.nvidia.com/compute/cuda/9.0/Prod/local_installers/cuda_9.0.176_384.81_linux-run
似乎可以使用wget下载但会很慢。想使用wget可参考《ubuntu 中wget (下载)命令用法》。
这里我发现了一位仁兄分享的axel下载方法,快的一批。《安装CUDA wget下载速度慢解决办法》
3.2 安装cuda
下载好文件名为cuda_9.0.176_384.81_linux-run
。
#先执行下面的命令安装相关依赖,
#否则会出现`Missing recommended library`错误
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
sudo sh cuda_8.0.61_375.26_linux.run #开始安装
#..一堆协议说明...
#直接按q退出协议说明.
zerozone@zerozone: accept/decline/quit: accept #接受协议
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 375.26?
y)es/(n)o/(q)uit: n #是否显卡驱动包,由于已经安装显卡驱动,选择n
Install the CUDA 8.0 Toolkit?
(y)es/(n)o/(q)uit: y #是否安装工具包,选择y
Enter Toolkit Location
[ default is /usr/local/cuda-8.0 ]: #工具包安装地址,默认回车即可
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: y #添加链接**注意这个连接,如果你之前安装过另一个版本的cuda,除非你确定想要用这个新版本的cuda,否则这里就建议选no,因为指定该链接后会将cuda指向这个新的版本**
Install the CUDA 8.0 Samples?
(y)es/(n)o/(q)uit: y #安装样例
Enter CUDA Samples Location
[ default is /root ]: #样例安装地址默认即可
# ***安装信息***
Installing the CUDA Toolkit in /usr/local/cuda-8.0 ...
Missing recommended library: libXi.so
Missing recommended library: libXmu.so
#注意,这里出现了Missing recommended library错误,
#是因为博主在第一次安装时,没有添加最开始的那条安装相关依赖的指令,
#之后我添加了依赖后,再次安装,就没有Missing错误了
Installing the CUDA Samples in /root ...
Copying samples to /root/NVIDIA_CUDA-8.0_Samples now...
Finished copying samples.
===========
= Summary =
===========
Driver: Not Selected
Toolkit: Installed in /usr/local/cuda-8.0
Samples: Installed in /root, but missing recommended libraries
Please make sure that
- PATH includes /usr/local/cuda-8.0/bin
- LD_LIBRARY_PATH includes /usr/local/cuda-8.0/lib64, or, add /usr/local/cuda-8.0/lib64 to /etc/ld.so.conf and run ldconfig as root
To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-8.0/bin
Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-8.0/doc/pdf for detailed information on setting up CUDA.
***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 361.00 is required for CUDA 8.0 functionality to work.
To install the driver using this installer, run the following command, replacing <CudaInstaller> with the name of this run file:
sudo <CudaInstaller>.run -silent -driver
Logfile is /tmp/cuda_install_6388.log
# ***安装完成***
这样安装完成cuda应该就指向cuda9.0了,可查看一下:
cd /usr/local
ls -l
安装过程中可能会有有关gcc的报错,参考:
《Error: unsupported compiler: 9.3.0》
《Ubuntu18.04安装CUDA 9.0时,Error: unsupported compiler: 7.3.0的解决方法》
《[ERROR]: unsupported compiler version: 9.3.0 when installing CUDA on 20.04》
4. 安装cudnn7.0.5
可以在网络找cudnn7.0.5的linux版本的下载文件,官网下载需要注册并登陆,我是用taobao买的csdn下载搞定的。
没有cudnn7运行代码会出现该报错ImportError: libcudnn.so.7: cannot open shared object file: No such file or directory
。
安装cudnn比较简单,可参考《阿里云 cuda9.1+cudnn 7.1+pytorch 环境搭建》或《Ubuntu安装和卸载CUDA和CUDNN》中的cudnn安装部分。
好了,这样就完成了Mask_RCNN的环境配置。