- 首先是装显卡驱动,显卡是英伟达的tesla v100,从官网上下载了驱动,系统是centos 7.5, 安装的时候首先提示安装kernel-devel,yum install即可,然后说找不到系统对应的源码,原来是下载的源码和系统版本对应不上,yun update kernel即可,紧接着又报gcc版本问题,说包的kernel是4.8.5 但是当前的gcc版本是6.3.1,出去gcc --version一看,是4.8.5啊,一脸懵逼,以为是自己理解错了,把gcc搞成了6.3.1的,结果一样的报错,一想是环境变量CC,cmake文件中的c编译器,一看果然是指向了6.3.1的gcc,改了之后编译到中间又出错,说不能加载nvidia.ko文件,导致这个的原因可能是已经有其他驱动了或者gcc版本不对,或者是和显卡不匹配,问题排查后只有gcc这个可能有问题,自然想到是编译c++代码的g++,看环境变量CXX发现果然是6.3.1的,改正后顺利完成,
- 安装cuda和cudnn cuda我下载的rpm包,yum localinstall + yum install搞定,cudnn解压拷贝即可
- 安装TensorFlow, 一开始直接pip install tensorflow==[version]了,结果是cpu版本的,pip install tensorflow-gpu
- 还是不行,找不到so文件,把cuda的lib加到LD_LIBRARY_PATH即可
- gcc下载地址http://ftp.gnu.org/
- pip install xxx -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
记一次装GPU环境
最新推荐文章于 2023-04-27 22:08:25 发布