hi!大家晚上好!
上次调通之后打算减少点数据集,但是不太确定训练集和验证集的对应关系,按我理解的不应该是一张训练的图像对应一张标签图像吗?但源代码中的数据集和验证集的数量关系大概是两倍,这一点我没太想明白。
之后随机选取了500张训练图像和1000张验证图像(保留原来1:2的数量关系),但是没跑成功。最后还是用原来的数据跑的,跑了11个epoch,loss和accuracy看着挺正常的,但是发现一直在CPU上跑,并没有用到GPU,再次阅读代码后发现里面并没有to(cuda)这种句子,因此打算自己添加上,尝试在GPU上运行下。
1.tensorflow与pytorch
PyTorch是由Facebook开发的开源深度学习框架,它在动态图和易用性方面表现出色。它以Python为基础,并提供了丰富的工具和接口,使得构建和训练神经网络变得简单快捷。
TensorFlow是由Google开发的深度学习框架,最初以静态计算图著称,但后来也引入了动态图机制。它支持多种编程语言,包括Python、C++和Java,并拥有强大的分布式计算能力。
2.验证自己的环境
参考了一些博主的代码
#显示使用的设备是CPU还是GPU
#from tensorflow.python.client import device_lib
#print(device_lib.list_local_devices())
#显示可使用的GPU数量
#import tensorflow as tf
#print("Num GPUs Available: ", len(tf.config.experimental.list_physical_devices('GPU')))
import tensorflow as tf
#print(tf.__version__) # 查看TensorFlow的版本
#print(tf.test.is_built_with_cuda()) # 判断CUDA是否可用
print(tf.test.is_gpu_available()) # 查看cuda、TensorFlow_GPU和cudnn(选择下载,cuda对深度学习的补充)版本是否对应
3.tensorflow与cuda版本
可以从官网上查询(但已经很久没更新了,可从网上搜索看需下载的版本其他网友的解决办法)
我的CUDA版本为:11.6
而之前下载的tensorflow版本为:2.5.0,且不是GPU版本
因此重新配置一个环境,其中tensorflow_gpu的版本改为:2.10.0(网址应该会改动,可更换)
pip install tensorflow-gpu==2.10.0 -i https://pypi.tuna.tsinghua.edu.cn/simple/
安装好tensorflow_gpu后,发现已经具有对应的numpy、Keras等库。
4.使用清华源pip安装的指令
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple xxx==版本
5. tf.test.is_gpu_available 是false
已经按照对应版本按照了tensorflow和cuda,还是报错?!
哞?
CUDA 12.3.99 ??
好好好,这是要重新升级了?
下次见!
引用文章
深入剖析PyTorch和TensorFlow:理解二者的区别与联系
pytorch和tensorflow函数对应关系(持续更新)
跑Tensorflow模型设置用GPU的一些总结(更加详细)
Windows环境下tensorflow使用GPU加速运算(详细解释)(很有帮助)
naconda虚拟环境下更换python版本【不论升版本、降版本都使用conda install python命令】【注意:修改版本后原来使用pip安装的包会被删掉,无法使用】
解决CUDA 11.6版本对应的tensorflow-gpu版本问题
tensorflow GPU测试tf.test.is_gpu_avaiable()返回false解决方法
1-一、安装NVIDIA控制面板_英美达控制面板安装-CSDN博客
tensorflow GPU测试tf.test.is_gpu_avaiable()返回false解决方法_tf.test.is_gpu_available()-CSDN博客