LLM训练：MFU计算方法

最新推荐文章于 2024-06-29 23:10:29 发布

一条水里的鱼

最新推荐文章于 2024-06-29 23:10:29 发布

阅读量2.1k

点赞数 10

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40859560/article/details/139130649

版权

一、引言

在进行大模型训练时，我们需要关注GPU资源的利用率，特别是GPU算力利用率通常可以作为大模型训练框架的性能指标，也直接影响训练大模型的成本。我们看到大家普遍使用 MFU（Model FLOPS Utilization）这个指标来评估GPU算力利用率[1]。本文主要介绍MFU的计算方法。

二、MFU的计算方法

1、mfu与hfu的概念

模型算力利用率（Model FLOPs Utilization， MFU）和硬件算力利用率（Hardware FLOPs Utilization， HFU）是评估某一模型实现对芯片计算性能利用情况的常用指标。

模型算力利用率是指_模型一次前反向计算消耗的矩阵算力与机器算力的比值_
硬件算力利用率是指_考虑重计算后，模型一次前反向计算消耗的矩阵算力与机器算力的比值_

数学公式：MFU = model FLOPs per iteration/（GPU单卡算力*卡数*一次迭代时间）

通用transformer模型一次前反向算力计算公式如下，model FLOPs per iteration：

所以通用的transformers模型 mfu 用公式表达如下:

最低0.47元/天解锁文章

一条水里的鱼

关注

10
点赞
踩
31

收藏

觉得还不错? 一键收藏
0
评论
LLM训练：MFU计算方法

在进行大模型训练时，我们需要关注GPU资源的利用率，特别是GPU算力利用率通常可以作为大模型训练框架的性能指标，也直接影响训练大模型的成本。我们看到大家普遍使用 MFU（Model FLOPS Utilization）这个指标来评估GPU算力利用率[1]。本文主要介绍MFU的计算方法。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。