浅谈AI算力优化技术

virtaitech

于 2021-07-27 18:25:34 发布

阅读量2.6k

点赞数 2

文章标签： gpu ai 人工智能

本文链接：https://blog.csdn.net/m0_49711991/article/details/119150248

版权

本文介绍了AI算力的重要性及其主要构成，特别是GPU在算力提供中的角色。文章详细讨论了如何通过GPU资源池化、计算精度优化和并行训练优化来提升算力效率，包括GPU虚拟化、混合精度计算和分布式训练框架的选择。此外，还提及了趋动科技在AI算力资源池构建方面的贡献。

摘要由CSDN通过智能技术生成

一、AI算力的主要构成

在人工智能三要素中，无论是数据还是算法，都离不开算力的支撑。根据IDC报告，过去，用户对于人工智能的感知更多停留在数据层和应用层，随着非结构化数据的激增和算法框架的日益复杂，算力不足的问题逐渐显现出来，越来越多的用户认识到算力的重要性。

根据《2020-2021中国人工智能计算力发展评估报告》显示，人工智能应用对算力最大的挑战来自于数据中心的模型训练。具有海量参数的模型训练几乎完全依赖于核心数据中心的算力支撑。比如2020年微软发布的智能感知计算模型Turing-NLG，参数量高达到175亿；OpenAI发布的GPT-3模型，参数量更达到1750亿，是GPT-2的100余倍。由于其庞大的参数体量，在给人工智能应用提供便利的同时，对AI算力提出了更高的要求。

因此，人工智能的算法越来越依赖于算力的发展。

目前，为AI提供算力的主流AI计算加速芯片主要为以下几种：

GPU：图形处理器（Graphics Processing Unit，GPU），又称显示核心、视觉处理器、显示芯片，是一种专门在个人电脑、工作站、游戏机和一些移动设备（如平板电脑、智能手机等）上图像运算工作的微处理器。