在经历了接近两天的瞎搞中,终于完成了ubuntu下用gpu训练模型,真是比cpu快了好多倍啊。。。
先看看成功结果图
可以看到这时的gpu平均利用率达到了80%以上,而cpu利用率保持在20%以下。
成功的标志:在python/python3环境中导入tensorflow-gpu成功(可以用 tensorflow._ _version __查看版本)。或者查看系统CPU和GPU使用情况。
必须强调的是
要想成功,版本对的上是关键,你若对不上,那就不可能成功
需要明白的是:tensorflow-gpu应该是会调用cuda提供的函数(或者说tensorflow-gpu通过cuda才能在gpu上运行),所以tensorflow的版本和cuda的版本需要对应;而cudnn又是建立在cuda上的,所以cudnn需要和cuda版本对应;同时keras往往使用tensorflow作为backend,所以keras需要和tensorflow-gpu版本对应(我估计若同时装有tensorflow和tensorflow-gpu的情况下,keras会优先利用tensorflow而不是tensorflow-gpu,所以请只保留tensorflow-gpu,反正多一