不同显卡(GPU)浮点数计算能力

本文探讨了GPU的浮点计算能力,重点关注单精度浮点处理能力的计算方式,涉及SP总数、SP运行频率和每条执行流水线每周期能执行的单精度浮点操作数。同时介绍了GPU架构中的TPC和GPC,以及它们与流处理器簇的关系。
摘要由CSDN通过智能技术生成


1、SP总数=TPC&GPC数量*每个TPC中SM数量*每个SM中的SP数量;

TPC和GPC是介于整个GPU和流处理器簇之间的硬件单元,用于执行CUDA计算。特斯拉架构硬件将SM组合成TPC(纹理处理集群),其中,TPC包含有纹理硬件支持(特别包含一个纹理缓存)和2个或3个SM,后面会有详细描述。费米架构

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值