目录
最近考虑用什么显卡来做AI训练,既不想太笨重,又希望有较强的计算能力。
纠结于用游戏本,还是用台式机,或者是用云计算平台?网上查了一些资料,稍微整理一下,方便以后对比查询,也给需要的朋友一些便利。
对于显卡的深度学习训练能力,我们不能只关注它有多少CUDA内核,还要看它的频率,显存,显存位宽等,比较客观的一个指标是看它的单精度性能(FP32)性能有多少Tflops。
Tflops理论峰值:
单精度理论峰值= GPU芯片数量*GPU Boost主频*核心数量*单个时钟周期内能处理的浮点计算次数。
单精度理论峰值 = FP32 cores * GPU Boost Clock * 2。