【训练营】8G 显存玩转书生大模型 Demo

构建环境并准备代码

在这里插入图片描述
运行
在这里插入图片描述

cli-demo 部署大模型

在这里插入图片描述
在这里插入图片描述

训练大型机器学习模型时,显存的需求计算比较复杂,因为它涉及到模型参数的数量、梯度累积、激活值、优化器状态等多个因素。没有一个统一的公式可以精确计算出训练过程中所有可能时刻所需的显存,因为这取决于具体的模型架构、批次大小(batch size)、数据类型以及训练中使用的各种技巧和优化方法。然而,可以提供一个大致的估算方法来帮助你了解显存需求。 1. 模型参数:这是由模型的权重和偏置数量决定的,可以通过计算模型中所有参数的数量乘以数据类型所占的字节(如float32通常是4字节)来估计。 2. 激活值:每个神经网络层的输出激活也需要存储空间,这部分空间取决于批次大小、特征图大小以及数据类型。 3. 梯度:在进行反向传播时,每个参数都会有一个梯度需要存储,其空间大小与模型参数相同。 4. 优化器状态:某些优化器(如Adam、RMSprop)会存储额外的状态信息,这也需要显存。 5. 缓冲区:还有其他一些临时缓冲区,比如用于计算损失函数、进行梯度累积的缓冲区等。 结合以上因素,一个粗略的显存需求计算公式可以是: 显存需求 ≈ 模型参数大小 + 激活值大小 + 梯度大小 + 优化器状态大小 + 缓冲区大小 每个部分的具体计算方法可能因框架和具体实现而异,通常在实际操作中需要考虑所使用的深度学习框架和具体配置,并结合实际运行情况来预估和调整。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值