FLOPS理解

最新推荐文章于 2024-05-27 10:02:12 发布

James-0

最新推荐文章于 2024-05-27 10:02:12 发布

阅读量1.1w

点赞数 1

分类专栏： GPU 文章标签： FLOPS GPU ARM

GPU 专栏收录该内容

5 篇文章 1 订阅

订阅专栏

在描述GPU的性能的时候，我们常常用到FLOPS进行描述。FLOPS是Floating-point Operations Per Second的简写，即每秒所能够进行的浮点运算数目。在以往形容GPU的运算性能的时候也常常用到其他单位，比如Triangles Per Second每秒所能够渲染的三角型数目，以及Pixels Per Second 每秒所能够渲染的像素个数等等。然而我们为什么会用到FLOPS这样表征计算能力的单位去描述GPU的能力呢？

答案是GPU的渲染过程本身就是一个密集计算的过程，常常需要包括大量的计算。举个例子，GPU渲染一个物体可以分解为以下步骤：

1. 将物体在三维空间进行建模，把它的空间几何结构分割为三角形进行表示同时记录各个三角形三维顶点坐标。

2. 建立一个光源位置，并指定光源的类型和亮度。

3. 建立照相机位置

4. 加载物体表面的纹理细节

5. 最后根据照相机的位置，将3D物体投影成2D画面

正如上面描述的那样，这个过程需要进行大量的三维计算，而这些计算通常是采用浮点数进行计算（floating-point），因此GPU的浮点计算能力是其性能的一个重要指标。

然而我们应该如何去计算GPU的FLOPS指标呢？以下是ARM的计算规则：

1. ARM GPU只提供ADD、MUL等经典算数运算指令。

2. 统计GPU的一个渲染器/算数流水线在一个时钟周期内能够执行多少的ADD和MUL操作。

3. 获取GPU的运行频率。

4. FLOPS = 单个算数流水线一个时钟内可执行指令数目 x 单核算数流水线个数 x GPU核心数目 x 运行频率

通常是一个很大的数目，因此我们常常采用GFLOPS（gigaflops）作为单位。在具体真正的Soc芯片实现上，通常可以达到理论计算97%的性能发挥。

关注

1
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
FLOPS理解

在描述GPU的性能的时候，我们常常用到FLOPS进行描述。FLOPS是Floating-point Operations Per Second的简写，即每秒所能够进行的浮点运算数目。在以往形容GPU的运算性能的时候也常常用到其他单位，比如Triangles Per Second每秒所能够渲染的三角型数目，以及Pixels Per Second 每秒所能够渲染的像素个数等等。然而我们为什么会...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。