BF16相比FP16的优点

BF16和FP16

参考链接:

BF16相比FP16的优点:

  • BF16和FP16都是两个字节,区别是指数位和小数位不一样
  • BF16的指数位和FP32一样,所以在整数表示的范围上,BF16和FP32保持一致,但是在小数精度上比较低。
    • 这样可以保证在模型训练的过程中尽量不要发生数据的溢出(上溢或者下溢),防止在一些计算中出现nan的数据(例如inf * 0 = nan),导致了模型的训练崩溃。
    • 小数精度上虽然BF16有损失,但是考虑到FP16在训练过程中,和FP32进行转换的时候,也会发生小数精度上的损失,所以小数精度虽然重要,但是相比数据溢出出现nan问题,可能并不是一个最大的问题,毕竟nan会导致模型无法正常训练,且一个参数出现nan,很快就会导致整个模型参数都变成nan。
  • 在混合精度训练过程中,BF16比FP16更加节省内容,这里我理解,是因为FP16的混合精度训练过程中,需要保存一个模型副本,然后前向推理过程中还需要一个FP16的副本。但是在BF16中,这个FP32和FP16的副本可以直接用一个FP32来使用,因为BF16相当于是FP32的前两个字节,需要用BF16的时候,直接截取前两个字节进行计算(这里可能会有精度损失,但是使用FP16这样转换也一样会有精度损失),需要FP32的时候,再把后两个字节加回来。
    • BF16转化到FP32更加简单,不需要做转化了,直接截取前2个字节。FP16和FP32之间的转换需要更多的逻辑操作。
    • 由于直接使用一个FP32来存储FP32和BF16的副本,所以这里减少了转换步骤,更加方便快捷
    • BF16 硬件可以实现比相同芯片尺寸的 FP32 单元更高的吞吐量(With fewer mantissa bits than FP16, the bfloat16 multipliers are about half the size in silicon of a typical FP16 multiplier, and they are eight times smaller than an FP32 multiplier!)
  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值