GPU浮点计算能力

奔跑的蜗牛super

已于 2023-08-08 14:20:30 修改

阅读量483

点赞数 1

分类专栏： GPU 文章标签：其他

于 2023-08-07 14:50:13 首次发布

原文链接：https://picture.iczhiku.com/weixin/message1570660281397.html

版权

GPU 专栏收录该内容

3 篇文章 1 订阅

订阅专栏

GPU的一个重要参数是浮点计算能力。
浮点计数是利用浮动小数点的方式使用不同长度的二进制来表示一个数字，与之对应的是定点数。同样的长度下浮点数能表达的数字范围相比定点数更大，但浮点数并不能精确表达所有实数，而只能采用更加接近的不同精度来表达。

FP32单精度计算
单精度的浮点数中采用4个字节也就是32位二进制来表达一个数字，1位符号，8位指数，23位小数，有效位数为7位。
在这里插入图片描述

FP64双精度计算
双精度浮点数采用8个字节也就是64位二进制来表达一个数字，1位符号，11位指数，52位小数，有效位数为16位。
在这里插入图片描述

FP16半精度计算
半精度浮点数采用2个字节也就是16位二进制来表达一个数字， 1位符号、5位指数、10位小数，有效位数为3位。
在这里插入图片描述

因为采用不同位数的浮点数的表达精度不一样，所以造成的计算误差也不一样。

对于需要处理的数字范围大而且需要精确计算的科学计算来说，就要求采用双精度浮点数，例如：计算化学，分子建模，流体动力学。
对于常见的多媒体和图形处理计算、深度学习、人工智能等领域，32位的单精度浮点计算已经足够了。
对于要求精度更低的机器学习等一些应用来说，半精度16位浮点数就可以甚至8位浮点数就已经够用了。

计算精度越高，意味着所需的计算资源、数据传输和内存存储就越多。其成本也会更大，同时也会消耗更多的功率。

对于浮点计算来说，CPU可以同时支持不同精度的浮点运算，但在GPU里针对单精度和双精度就需要各自独立的计算单元，一般在GPU里支持单精度运算的单精度ALU(算术逻辑单元)称之为FP32 core，而把用作双精度运算的双精度ALU称之为DP unit或者FP64 core。

奔跑的蜗牛super

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
GPU浮点计算能力

对于浮点计算来说，CPU可以同时支持不同精度的浮点运算，但在GPU里针对单精度和双精度就需要各自独立的计算单元，一般在GPU里支持单精度运算的单精度ALU(算术逻辑单元)称之为FP32 core，而把用作双精度运算的双精度ALU称之为DP unit或者FP64 core。单精度的浮点数中采用4个字节也就是32位二进制来表达一个数字，1位符号，8位指数，23位小数，有效位数为7位。双精度浮点数采用8个字节也就是64位二进制来表达一个数字，1位符号，11位指数，52位小数，有效位数为16位。
复制链接

扫一扫

专栏目录

奔跑的蜗牛super CSDN认证博客专家 CSDN认证企业博客

码龄6年

11: 原创

52万+: 周排名

211万+: 总排名

5万+: 访问

: 等级

182: 积分

41: 粉丝

45: 获赞

4: 评论

331: 收藏

私信

关注

热门文章

分类专栏

GPU 3篇
PCIE 12篇
BMC 1篇

最新评论

内存映射技术-MMIO
大樹bigtree: 描述的应该有问题，CPU访问PCIe设备的数据是不需要RC读到内存的，CPU拿到PCIe设备的数据直接是RC通过TLB协议获取，另外PCIe设备也可以直接访问内存，这样免去了CPU的搬运。PCI设备使用CPU可以简单像访问内存一样访问PCI设备的数据，PCI设备也能像DMA一样把数据搬到内存。。。
PCIe Capability结构寻址
lantian728: 后面通过link status 寄存器offset 0x12h计算时，数错位了，不是0x7c11，应该是向后数十进制的18位，是0x1011，二进制0001 0000 0001 0001，第4-9位是000001，对应x1
PCIe热插拔：通知试热插拔&暴力热插拔
天才小C: 有点疑惑，插入设备的时候这个清除hotplug status时机是不是有点问题，pciehp_isr中断函数读清了slot status register寄存器，但是我看pci spec Data link layer status change中断是根据slot status register的状态触发的吧
PCIe Capability结构寻址
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/616568832。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。