安装环境:
https://blog.csdn.net/wu496963386/article/details/109583045
基本按照上述链接博主方法安装tensorflow1.15.4
本链接在原博主基础上修改了cudnn包,增加了多gpu需要的nccl,openmpi,horvod支持,以及本人安装成功的环境使用conda pack打包好,有缘人可直接使用pack包恢复环境。
链接: https://pan.baidu.com/s/1P49bpgSy4UXJvahs6SajKw 提取码: kgmt
对比:
输入
输入大小:576*1024×3
网络计算量:97GFLOPs
1080Ti主机(四卡,只评测两张卡,即1080Ti *2)环境:
cudatoolkit 10.0.130
cudnn 7.6.5
tensorflow15.1
训练设置:
bathsize=16(batchsize=8 per-gpu)
每 625 steps,时间: 4分10秒(4:10)
3090主机(3090*2)环境:
cuda 11.1
cudnn 8.0.4
tensorflow1.15.4
训练设置:
bathsize=16(batchsize=8 per-gpu)
每 625 steps,时间: 2分30秒(2:30)
bathsize=32(batchsize=16 per-gpu)
每625 steps,时间: 4分04秒(4:04)
只用一张3090启动训练:
batchsize16单卡
每625 steps,时间: 4分0秒(4:00)
结论:
一张更比两张强,但也是真贵,买二手1080Ti还是更香一点,当然,如果只买新卡,相对于2080Ti来说,还是直接上3090。
2021年1月,二手1080Ti:3500+, 3090:17000+, 2080Ti:10000+