valid floating point value什么意思_TFLOPS啥意思 性能对比这样看才靠谱

RTX 30显卡的在线发布会上有一个细节特别引人瞩目,那就是公布了一个名为TFLOPS的数据时,如果大家收看的视频有弹幕,一定马上就会弹幕爆炸了。这个参数到底是啥?为什么让大家那么关注呢?咱们今天就来说说吧。

16d5f10bd0a5e27b2e09830acbd3b54c.png

TFLOPS是Tera和Floating-point operations per second词组的组合,后者的意思是每秒浮点运算次数,Tera则是万亿的意思,合起来就是每秒浮点运算多少万亿次。因为现在的图像是分成像素点来处理的,每个点的色彩都要进行浮点运算,然后组合成一幅图片,所以这个参数就说明了显卡或者GPU每秒能处理多少个像素点。

27dee84315bfa937f0c0aac02206e43a.png

它的基础就来自现在的GPU设计,目前的GPU都是由很多小处理核心或者叫流处理器组成,这个核心比处理器核心简单得多,每个时钟周期只负责处理一个浮点数据,所以总的浮点运算次数就是核心数量×时钟周期了。又因为现在的核心可以一次性处理一个双精度浮点数据,它相当于两个最基础的单精度浮点数据,所以再×2就得到了GPU的浮点运算次数。

7499974bb9e7ddae61a1237cd0ba29d8.png

回过头来看看这个参数对游戏有啥意义。在分辨率确定后,每一幅画面的像素点数量也就确定了,那么每秒处理的像素点越多,实际上每秒能处理的画面数量当然就越多。这说明了啥?当然就是游戏的帧速(每秒画面数)越高啦。没错,对使用同一代特别是同一核心的显卡,算出它的浮点运算能力,基本就了解游戏速度了。

2070836b76983302bc771afcdeea9177.png

不过对于不同代甚至不同架构的GPU,这种对比就不合适了,比如RTX 3080拥有两倍于RTX 2080 Ti的浮点运算次数,帧速能达到RTX 2080 Ti的两倍吗?从之前的测试大家就知道,当然不是这样。

1d3af13770bdd7d5c3eac08776bf1b70.png

这就牵扯出了另一个问题,也就是核心的效率,因为谁也不能保证所有的核心或者流处理器能一直满载、有效运行,它的实际发挥还要考虑到前端的分配、后端的合成、显存数据等单元的配合,所以设计不同的架构下,按照最理想情况算出的浮点运算次数能发挥多少也是不同的。

b53ca3fe1d507cac415dc40946fca75d.png

RTX 30还有所不同,因为它实际上是让每个核心中的整数运算单元也参加浮点运算,造成了“理论”运算能力翻倍、但因为干的是非专业工作,整数单元的浮点运算效率肯定赶不上专业的浮点运算单元,再加上前端的数据分配能力、显存带宽啥的没有跟着翻倍,所以效率大幅下降,最终我们可以看到,翻倍的浮点运算能力带来的只是不到40%的实际帧速提升。

8b3aad2b2fbf5f48530f7f5895db93b2.png
06d4305141cac951447413e535145bbd.png

既然同一个厂家在架构上的改动都会造成浮点运算能力的实际发挥,AMD和NV这种相差更远的架构就别提了,比如RX 6800系列用了比较特殊的架构设计,就以远低于RTX 3080/3070的浮点运算能力,得到了能抗衡甚至压制它们的性能。

d226594a60a26b9d799d9fbb6eecda4f.png
6cfc9520b39265866f1ca65f2808a02f.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值