随着深度学习不断渗透到各个AI应用场景,越来越多的研发人员开始依赖GPU算力加速深度学习模型的训练。也有人戏称GPU为深度学习领域的核武器,虽然很多芯片公司都提供了相应的芯片解决方案,但是较为主流的方式还是选用英伟达的GPU并使用上层的CUDA和cuDNN驱动生态进行深度学习应用的开发。由于英伟达新品不断推出,我们列举特定型号的GPU没有太大意义,所以结合选型的不同场景和需求,根据场景进而选择型号的形式更容易应对更迭。
当然除了深度学习,GPU还用于比特币挖矿,游戏渲染和科学计算吗,所以相应设备和服务之前就已经有很多厂商进行提供。
1 公有云方案
Amazon,微软,阿里云等是较为有代表性的厂商,相继提供了不同的解决方案,不同厂商比价较为严重,所以一般价格不会相差悬殊。
1.1 微软Azure
以Azure为例,相应配置和价格可以参考:
https://docs.microsoft.com/en-us/azure/virtual-machines/windows/sizes-gpu
- NC, NCv2, NCv3, and ND sizes are optimized for compute-intensive and network-intensive applications and algorithms, including CUDA- and OpenCL-based applications and simulations, AI, and Deep Learning.
- NV sizes are optimized and designed for remote visualization, streaming, gaming, encoding, and VDI scenarios utilizing frameworks such as OpenGL and DirectX.
1.2 Amazon AWS
1.3 阿里云
2 超算中心方案