[torch] torch profiler使用示例

今天需要使用profiler来分析LLM的性能,所以特地的尝试了一下,我这里把示例代码分享给搭建,希望大家编程顺利:

import time
import torch
from transformers import AutoTokenizer, AutoModel
import torch.profiler as profiler
model_name_or_path = 'THUDM/chatglm-6b'
tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, trust_remote_code=True)
model = AutoModel.from_pretrained(model_name_or_path, trust_remote_code=True).half().cuda()
model = model.eval()
prompt = "你好"
inputs = tokenizer([prompt], return_tensors="pt")
inputs = inputs.to("cuda")
prof = profiler.profile(
            activities=[
                torch.profiler.ProfilerActivity.CPU,
                torch.profiler.ProfilerActivity.CUDA,
            ],
            schedule=torch.profiler.schedule(
                wait=1,
                warmup=1,
                active=2,
                repeat=1),
        )

with torch.no_grad():
    for i in range(5):
        result = model(**inputs)

with torch.no_grad():
    for i in range(10):
        start = time.perf_counter()
        # response, history = model.chat(tokenizer, "你好", history=[])
        # print(response)
        result = model(**inputs)
        hf_cost = (time.perf_counter() - start) * 1000
        print("Speed tokenizer:", hf_cost)
        prof.step()

print(prof.key_averages().table(sort_by="self_cpu_time_total"))

我给的示例是chatglm的,有需要的可以换成其他的模型,原理是一样的。

参考文献

PyTorch Profiler

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

农民小飞侠

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值