BF16相比FP16的优点

最新推荐文章于 2025-03-12 11:30:16 发布

kejizuiqianfang

最新推荐文章于 2025-03-12 11:30:16 发布

阅读量1.5k

点赞数 3

分类专栏：深度学习 python 文章标签： BF16 FP16 FP32 半精度混合精度大模型数据溢出

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kejizuiqianfang/article/details/139533630

版权

python 同时被 2 个专栏收录

20 篇文章

订阅专栏

19 篇文章

订阅专栏

BF16和FP16

参考链接：

BF16相比FP16的优点：

BF16和FP16都是两个字节，区别是指数位和小数位不一样
BF16的指数位和FP32一样，所以在整数表示的范围上，BF16和FP32保持一致，但是在小数精度上比较低。
- 这样可以保证在模型训练的过程中尽量不要发生数据的溢出（上溢或者下溢），防止在一些计算中出现nan的数据（例如inf * 0 = nan），导致了模型的训练崩溃。
- 小数精度上虽然BF16有损失，但是考虑到FP16在训练过程中，和FP32进行转换的时候，也会发生小数精度上的损失，所以小数精度虽然重要，但是相比数据溢出出现nan问题，可能并不是一个最大的问题，毕竟nan会导致模型无法正常训练，且一个参数出现nan，很快就会导致整个模型参数都变成nan。
在混合精度训练过程中，BF16比FP16更加节省内容，这里我理解，是因为FP16的混合精度训练过程中，需要保存一个模型副本，然后前向推理过程中还需要一个FP16的副本。但是在BF16中，这个FP32和FP16的副本可以直接用一个FP32来使用，因为BF16相当于是FP32的前两个字节，需要用BF16的时候，直接截取前两个字节进行计算（这里可能会有精度损失，但是使用FP16这样转换也一样会有精度损失），需要FP32的时候，再把后两个字节加回来。
- BF16转化到FP32更加简单，不需要做转化了，直接截取前2个字节。FP16和FP32之间的转换需要更多的逻辑操作。
- 由于直接使用一个FP32来存储FP32和BF16的副本，所以这里减少了转换步骤，更加方便快捷
- BF16 硬件可以实现比相同芯片尺寸的 FP32 单元更高的吞吐量（With fewer mantissa bits than FP16, the bfloat16 multipliers are about half the size in silicon of a typical FP16 multiplier, and they are eight times smaller than an FP32 multiplier!）

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。