常见GPU算力(5090&5090D,GB202-300&GB202-250)

一、硬件参数

50905090D
核心GB202-300GB202-250
架构BlackwellBlackwell
SM170170
CUDA Cores / SM128128
CUDA Cores / GPU2176021760
Tensor Cores / SM4 (5th Gen)4 (5th Gen)
Tensor Cores / GPU680 (5th Gen)680 (5th Gen)
GPU 加速频率2407 MHz2407 MHz
显存32 GB (GDDR7)32 GB (GDDR7)
显存位宽512 bit512 bit
显存速率28 Gbps28 Gbps
显存带宽1792 GBps1792 GBps
一缓128 KB (per SM)128 KB (per SM)
二缓96 MB96 MB
TGP575 W575 W
制程TSMC 4N (5nm)TSMC 4N (5nm)

        注意到,完整 GB202 核心有 12 组 GPC,每组 GPC 包含 8 组 TPC(4090 的 AD102 中是 6 组),单个 TPC 中含有两个 SM 单元,因此完整 GB202 核心共有 192 个 SM 单元,但 GB202-300 和 GB202-250 只开启其中的 170 个。每个 SM 单元中有 128 个 CUDA 计算单元,这 128 个 CUDA 都可以计算 FP32 或 INT32(4090 的 AD102 中 64 个 CUDA 可以计算 FP32 或 INT32,另外 64 个只能计算 INT32)。

        每个 SM 单元中有 4 个 Tensor Core,因此 GB202-300 和 GB202-250 总共含有 680 个 Tensor Core。支持的数据类型有 FP8、FP16、BF16、TF32、INT8、INT4、FP6、FP4,不支持 FP64。和 AD102 相比,新增支持 FP6 和 FP4,且采用第二代 FP8 Transformer 引擎。

二、算力

1、CUDA Core 算力

浮点:TFLOPS

整型:TIOPS

50905090D
FP32104.8104.8
FP16104.8104.8
FP641.641.64
BF16104.8104.8
INT32104.8104.8

2、Tensor Core 算力

浮点:TFLOPS

整型:TIOPS

稠密/稀疏

50905090D*
FP41676 / 3352NA / 2375
FP8838 / 1676NA / NA
FP16419 / 838NA / NA
BF16209.5 / 419NA / NA
TF32104.8 / 209.5NA / NA
INT8838 / 1676NA / NA
INT41676 / 3352NA / NA

*5090D 的 Tensor Core 算力有待考证

<think>好的,我现在需要帮助用户解决在使用Bitfusion时遇到的错误:“invalid value 20GB for flag -memory:parse error”。用户之前询问如何通过Bitfusion远程运行ollama模型,现在遇到了参数解析错误的问题。首先,我要理解这个错误的原因。 根据错误信息,问题出在`--memory`参数的格式上。用户输入的`20GB`可能不符合Bitfusion的要求。我需要回忆Bitfusion文档中关于内存参数的规定。通常,命令行参数对于内存的表示可能有特定的格式,比如是否允许空格,是否使用不同的单位缩写,或者是否需要特定的数值格式。 接下来,我应该检查用户之前给出的命令示例。用户之前建议的命令是`bitfusion run -n 1 --memory=20GB ollama run DeepSeek-R1-14b`。这里可能的问题点在于`20GB`的写法。有些工具要求单位前没有空格,或者使用小写字母,比如`20g`或`20gb`。也可能Bitfusion需要特定的单位格式,例如仅接受整数加上单位,或者不接受大写字母。 然后,我需要验证不同的参数写法。例如,尝试将`20GB`改为`20g`或`20G`,看看是否能解决问题。另外,还要确认Bitfusion是否支持`GB`作为单位,或者是否必须使用`MB`或`GiB`等。有时候,工具可能对单位的大小写敏感,比如只接受小写的`g`而不是大写的`G`。 此外,还要考虑参数的位置是否正确。可能`--memory`必须紧跟在某个其他参数之后,或者不能与其他参数冲突。例如,是否需要在`--memory`前指定其他资源参数,或者是否参数之间有依赖关系。 另一个可能性是用户使用的Bitfusion版本较旧,不支持`--memory`参数的单位缩写,必须使用纯数字(比如以MB为单位的数值)。例如,20GB等于20480MB,所以用户可能需要输入`--memory=20480`。 还需要检查Bitfusion的文档或帮助信息,通过运行`bitfusion run --help`查看`--memory`参数的正确用法。如果用户没有权限或无法查看帮助文档,可能需要根据经验推断正确的格式。 此外,用户的环境变量或其他配置可能影响参数解析,但这种情况较为少见。可能用户的操作系统或Shell对参数的处理有特殊要求,比如需要转义空格或特殊字符,但根据错误信息,这似乎是一个参数解析错误,而不是环境问题。 最后,总结可能的解决方案:尝试不同的单位格式(如`20g`、`20G`、`20480`),确保没有空格,使用正确的单位缩写,并检查Bitfusion的文档确认正确的语法。如果这些尝试无效,可能需要进一步检查Bitfusion的日志或联系支持团队获取帮助。</think>### 一、错误原因分析 您遇到的 `invalid value 20GB for flag -memory:parse error` 错误是由于 **内存参数格式不符合 Bitfusion 要求** 造成的。以下是具体技术解析: 1. **单位格式错误** Bitfusion 要求内存参数使用 **纯数字 + 无空格单位** 格式,且单位必须为小写字母: ```bash # 正确格式 --memory=20g # 单位用 'g' 或 'm' --memory=20480m # 20GB = 20480MB # 错误格式 --memory=20GB # 大写单位 --memory=20 g # 含空格 ``` 2. **版本兼容性问题** Bitfusion v2.3 之前版本不支持 `GB` 单位,必须使用 `MB` 数值表示: ```bash # 旧版本兼容写法 --memory=20480 # 默认单位为 MB ``` --- ### 二、修复方案 #### 方案 1:标准单位修正 ```bash bitfusion run -n 1 --memory=20g ollama run DeepSeek-R1-14b ``` #### 方案 2:MB 单位显式声明 ```bash bitfusion run -n 1 --memory=20480m ollama run DeepSeek-R1-14b ``` #### 方案 3:无单位数值(兼容旧版) ```bash bitfusion run -n 1 --memory=20480 ollama run DeepSeek-R1-14b # 单位默认为 MB ``` --- ### 三、验证步骤 通过以下命令验证参数格式: ```bash # 查看内存参数支持的格式 bitfusion run --help | grep -A 2 '\-\-memory' # 测试最小内存分配 bitfusion run -n 1 --memory=1g nvidia-smi # 应正常显示 GPU 信息 ``` --- ### 四、高级配置建议 #### 1. 动态显存分配(需 Bitfusion v3.0+) ```bash bitfusion run -n 1 --memory=dynamic ollama run DeepSeek-R1-14b ``` #### 2. 多 GPU 显存叠加 ```bash # 使用 2 张 GPU,每卡分配 10GB bitfusion run -n 2 --memory-per-gpu=10g ollama run DeepSeek-R1-14b ``` --- ### 五、参数格式对照表 | 参数类型 | 合法格式 | 非法格式 | 说明 | |---------|---------|----------|-----| | 内存 | `20g` | `20GB` | 单位必须小写 | | 内存 | `20480m` | `20,480m` | 禁止千分位分隔符 | | GPU数量 | `-n 2` | `--gpus=2` | 必须使用 `-n` 参数 | --- ### 六、常见问题排查 若仍报错,请检查: ```bash # 查看 Bitfusion 版本 bitfusion version # 检查服务端配置(需管理员权限) sudo bitfusion config show | grep memory_allocation_unit # 典型输出(决定单位解析方式): # memory_allocation_unit = "GB" # 服务端若配置 GB 单位,客户端必须用数字 ``` --- ### 七、跨版本兼容脚本 编写自动适配脚本 `run_ollama.sh`: ```bash #!/bin/bash # 检测 Bitfusion 版本 VERSION=$(bitfusion version | awk '{print $3}' | cut -d'.' -f1) if [ $VERSION -ge 3 ]; then MEM_ARG="--memory=20g" else MEM_ARG="--memory=20480" fi bitfusion run -n 1 $MEM_ARG ollama run DeepSeek-R1-14b ``` --- 通过以上修正,您应该能成功调用远程 GPU 运行大语言模型。如遇其他问题,建议附加 `--debug` 参数获取详细日志: ```bash bitfusion run --debug -n 1 --memory=20g ollama run DeepSeek-R1-14b ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值