安装cudnn
开始以为是因为我的GPU太low,是GPU 920M,刚刚够,计算能力3.5。后来发现不是,我安装cuda后是在anaconda上安的cudnn,估计是没装对。我的是cuda10.1,要下对应版本的cudnn。
于是我在官网重新下了cudnn,顺带一提,我打开NVIDIA官网,会自动重定向到错误页面,叫NVIDIA Developer error,于是我下载好了迅雷,然后一打开页面看到出来了下载链接就立刻停止浏览器加载网页,尔后右击复制下载链接。打开迅雷自动提示下载,这样下载好cudnn。
然后打开C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1
将cudnn中的bin,include,lib中的内容复制粘贴到CUDA中对应文件夹里面。其中lib中还有个x64文件夹,要点进去复制一个.lib后缀的压缩包。
vscode调用GPU出错
我从anaconda中创建了tensorflow虚拟环境,在里面下载tensorflow-gpu 2.1.0,keras 2.3.1,下载成功。
当我打开vscode运行GPU测试程序时,出错:
Attempting to fetch value instead of handling error Internal: failed to get device attribute 13 for device 0: CUDA_ERROR_UNKNOWN: unknown error
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense,Dropout,LSTM
mnist = tf.keras.datasets.mnist
(x_train,y_train),(x_test,y_test)=mnist.load_data()
print(x_train.shape)
print(x_train[0].shape)
x_train=x_train/255.0
x_test=x_test/255.0
model=Sequential()
model.add(LSTM(128,input_shape=(x_train.shape[1:]),return_sequences=True))
model.add(Dropout(0.2))
model.add(LSTM(128))
model.add(Dropout(0.2))
model.add(Dense(32,activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(10,activation='softmax'))
opt= tf.keras.optimizers.Adam(lr=1e-3,decay=1e-5)
model.compile(loss='sparse_categorical_crossentropy',
optimizer=opt,
metrics=['accuracy'])
model.fit(x_train,y_train,epochs=3,validation_data=(x_test,y_test))
##error when use GPU
#Attempting to fetch value instead of handling error Internal: failed to get device attribute 13 for device 0: CUDA_ERROR_UNKNOWN: unknown error
然后我打开了anaconda,加载tensorflow环境,安装了spider,在spider中运行成功:
经测试,pycharm也能运行,但第一次运行的时候也发生了一样的错误,第二次就好了。
vscode的扩展bug还是有点多,我想起了我的Java的scanner似乎就读取不了中文。总之用vscode编程遇到问题,如果网上找不到解决办法,要换个IDE试试,很可能是vscode扩展的bug。