ValueError: No available memory for the cache blocks. Try increasing `gpu_memory_utilization`

在运行chatglm-4v-9b的时候出现了报错

ValueError: No available memory for the cache blocks. Try increasing `gpu_memory_utilization` when initializing the engine.

在这里插入图片描述
我的服务器的大小大概在30G
在这里插入图片描述
这是模型运行期间占用的内存大小

Memory profiling results: total_gpu_memory=31.73GiB
initial_memory_usage=26.64GiB peak_torch_memory=26.45GiB
memory_usage_post_profile=26.69GiB non_torch_memory=0.74GiB
kv_cache_size=3.91GiB gpu_memory_utilization=0.9

可以看出来基本占满了,gpu_memory_utilization默认开到了0.9,这个参数的高低代表了在使用GPU时,分配给模型和缓存的内存比例。果将 gpu_memory_utilization 设置为较高的值,这意味着模型可以使用更多的GPU内存。这通常会提高模型的性能,因为可以缓存更多的数据和中间结果,从而加快计算速度。虽然高的 gpu_memory_utilization 可以提高性能,但如果设置得过高,可能会导致GPU内存不足(OOM)错误,尤其是在处理大型模型或数据集时。

所以一开始我把数字改小,从0.9改到0.6,再改到0.3、0.1、甚至是0.05,都没有区别。所以我干脆反方向操作,把内存比例开大,改成0.95的时候,通了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yitahutu79

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值