写在前面:
本文主要是深度学习训练时候的一些经验和用法的笔记。
1、TensorFlow训练时指定GPU
在终端执行程序时指定GPU
CUDA_VISIBLE_DEVICES=0,1 python your_file.py
在Python代码中指定GPU
import os
os.environ["CUDA_VISIBLE_DEVICES"] = "0"
设置定量的GPU使用量
config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.9 # 占用GPU90%的显存
session = tf.Session(config=config)
设置最小的GPU使用量
config = tf.ConfigProto()
config.gpu_options.allow_growth = True
session = tf.Session(config=config)
2、最近使用jupyter notebook时出现no module named cv2,解决办法 pip install opencv-python
3、ImportError: No module named 'google',解决办法 pip install protobuf
4、ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory
解决办法:
步骤一:在PATH中加入cuda
sudo vim ~/.bashrc
在末尾加入:
export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda
使之生效:
source ~/.bashrc
发现此时import tensorflow还是报一样的错误,所以进行步骤二
步骤二:
检查 /usr/local/cuda-9.0/lib64 下是否有 libcublas.so.9.0
如果有,终端输入:
sudo ldconfig /usr/local/cuda-9.0/lib64