常见GPU算力(4090&4090D,AD102-300&AD102-250)

一、硬件参数

40904090D
核心AD102-300AD102-250
架构Ada LovelaceAda Lovelace
SM128114
CUDA Cores / SM128128
CUDA Cores / GPU1638414592
Tensor Cores / SM4 (4th Gen)4 (4th Gen)
Tensor Cores / GPU512 (4th Gen)456 (4th Gen)
GPU 加速频率2520 MHz2520 MHz
显存24 GB (GDDR6X)24 GB (GDDR6X)
显存位宽384 bit384 bit
显存速率21 Gbps21 Gbps
显存带宽1008 GBps1008 GBps
一缓128 KB (per SM)128 KB (per SM)
二缓72 MB72 MB
TGP450 W425 W
制程TSMC 4N (5nm)TSMC 4N (5nm)

        注意到,完整 AD102 核心有 12 组 GPC,每组 GPC 包含 6 组 TPC,单个 TPC 中含有两个 SM 单元,因此完整 AD102 核心共有 144 个 SM 单元,但 AD102-300 只开启其中的 128 个,AD102-250 只开启其中的 114 个。每个 SM 单元中有 128 个 CUDA 计算单元,其中 64 个 CUDA 可以计算 FP32 或 INT32,另外 64 个只能计算 INT32。

        每个 SM 单元中有 4 个 Tensor Core,因此 AD102-300 总共含有 512 个 Tensor Core,AD102-250 总共含有 456 个 Tensor Core。支持的数据类型有 FP8、FP16、BF16、TF32、INT8、INT4,不支持 FP64。对于 FP16 数据,每个 Tensor Core 每周期可以完成 64 次 FMA(乘加)操作,因 FMA 算作两次浮点运算,所以相当于 128 个 FP16 FLOPs;对于 INT8 数据,每个 Tensor Core 每周期能完成 128 次运算;对于 INT4 数据,每周期则能完成 256 次运算。启用稀疏计算(2:4 模式)加速后,在神经网络权重中,强制每 4 个连续元素中至少 2 个为零,Tensor Core 硬件自动跳过零值计算,有效吞吐量翻倍。

二、算力

1、CUDA Core 算力

浮点:TFLOPS

整型:TIOPS

40904090D
FP3282.673.5
FP1682.673.5
FP641.291.149
BF1682.673.5
INT3241.336.8

2、Tensor Core 算力

浮点:TFLOPS

整型:TIOPS

稠密/稀疏

40904090D
FP8660.6 / 1321.2588.4 / 1176.8
FP16330.3 / 660.6294.2 / 588.4
BF16165.2 / 330.4147.1 / 294.2
TF3282.6 / 165.273.5 / 147.1
INT8660.6 / 1321.2588.4 / 1176.8
INT41321.2 / 2642.41176.8 / 2353.6

### PyCharm 打开文件显示全的解决方案 当遇到PyCharm打开文件显示全的情况时,可以尝试以下几种方法来解决问题。 #### 方法一:清理缓存并重启IDE 有时IDE内部缓存可能导致文件加载异常。通过清除缓存再启动程序能够有效改善此状况。具体操作路径为`File -> Invalidate Caches / Restart...`,之后按照提示完成相应动作即可[^1]。 #### 方法二:调整编辑器字体设置 如果是因为字体原因造成的内容显示问题,则可以通过修改编辑区内的文字样式来进行修复。进入`Settings/Preferences | Editor | Font`选项卡内更改合适的字号大小以及启用抗锯齿功能等参数配置[^2]。 #### 方法三:检查项目结构配置 对于某些特定场景下的源码视图缺失现象,可能是由于当前工作空间未能正确识别全部模块所引起。此时应该核查Project Structure的Content Roots设定项是否涵盖了整个工程根目录;必要时可手动添加遗漏部分,并保存变更生效[^3]。 ```python # 示例代码用于展示如何获取当前项目的根路径,在实际应用中可根据需求调用该函数辅助排查问题 import os def get_project_root(): current_file = os.path.abspath(__file__) project_dir = os.path.dirname(current_file) while not os.path.exists(os.path.join(project_dir, '.idea')): parent_dir = os.path.dirname(project_dir) if parent_dir == project_dir: break project_dir = parent_dir return project_dir print(f"Current Project Root Directory is {get_project_root()}") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值