llama decoder流程一图解释及activation空间占用

在这里插入图片描述

如图所示,为 llama 中一个llamalayer或一个llamadecoder的计算流程,其中标注了每一个Tensor的shape。
1)浅黄色(比如,K,Q,V等),表示计算输出
2)黄色的casual mask表示 mask 的Tensor(FP32格式)
3)灰黄色+斜纹(比如X1,X2等),表示反向计算时需要用到的Tensor(activation)
4)其它,表示计算操作,有的操作有权重,有的操作没有权重
5)右下方给出了 activation 的空间占用,及由此推出的 llama 模型在各种情况下的空间占用(中间变量activation)

  • 10
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值