打工日志11.25

在API优化过程中发现,接口初次调用耗时较长,原因是GPU首次计算时间较长,可能是GPU初始化过程导致。通过预执行GPU操作进行初始化,可以解决这个问题。虽然对多数应用影响不大,但对于线上接口服务,首次调用时延尤其重要,建议在服务启动时预先初始化GPU。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天在进行API优化排查的时候发现接口在第一次进行调用的时候的运行耗时明显高于之后的调用。

后来经过排查,其实是因为GPU的第一次调用计算会明显高于之后的计算时间。我觉得可能是因为GPU要初始化的原因?

下面做一个简单的小实验,像这样子的,循环计算多次

import torch
import time

if __name__ == '__main__':
    device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu")
    for i in range(0, 100):
        st = time.time()
        a1 = torch.rand(9999, 9999).to(device)
        b1 = torch.rand(9999, 9999).to(device)
        torch.mul(a1, b1)
        et = time.time()
        print('In computation {}, the computing operation costs {}ms'.format(str(i), (et-st)))
        time.sleep(2)

输出如下:

In computation 0, the computing operation costs 4.841561555862427ms
In computation 1, the computing operation costs 1.8976020812988281ms
In computation 2, the computing operation costs 1.9691121578216553ms
In computation 3, the computing operation costs 1.8744938373565674ms
In computation 4, the computing operation costs 1.8520243167877197ms
...

但是只要在前面随机进行一下gpu的操作,让GPU初始化完成,时间就正常了。。

import torch
import time
import logging

if __name__ == '__main__':
    device = torch.device("cuda:1" if torch.cuda.is_available() else "cpu")
    before_laodd = torch.rand(9999, 9999).to(device)
    for i in range(0, 100):
        st = time.time()
        a1 = torch.rand(9999, 9999).to(device)
        b1 = torch.rand(9999, 9999).to(device)
        torch.mul(a1, b1)
        et = time.time()
        print('In computation {}, the computing operation costs {}ms'.format(str(i), (et-st)))
        time.sleep(2)

output:

In computation 0, the computing operation costs 1.9176990985870361ms
In computation 1, the computing operation costs 1.9287288188934326ms
In computation 2, the computing operation costs 1.8840551376342773ms
...

这个看似好像对实际应用没啥影响,但是因为我们是做线上的接口服务,大部分用户在启动服务之后,可能就只调用一次,那么首次的时延就显得非常重要。
做接口的时候,启动服务时要顺便初始化一下GPU呀

内容概要:本文详细介绍了QY20B型汽车起重机液压系统的设计过程,涵盖其背景、发展史、主要运动机构及其液压回路设计。文章首先概述了汽车起重机的分类和发展历程,强调了液压技术在现代起重机中的重要性。接着,文章深入分析了QY20B型汽车起重机的五大主要运动机构(支腿、回转、伸缩、变幅、起升)的工作原理及相应的液压回路设计。每个回路的设计均考虑了性能要求、功能实现及工作原理,确保系统稳定可靠。此外,文章还详细计算了支腿油缸的受力、液压元件的选择及液压系统的性能验算,确保设计的可行性和安全性。 适合人群:从事工程机械设计、液压系统设计及相关领域的工程师和技术人员,以及对起重机技术感兴趣的高等院校学生和研究人员。 使用场景及目标:①为从事汽车起重机液压系统设计的工程师提供详细的参考案例;②帮助技术人员理解和掌握液压系统设计的关键技术和计算方法;③为高等院校学生提供学习和研究起重机液压系统设计的实用资料。 其他说明:本文不仅提供了详细的液压系统设计过程,还结合了实际工程应用,确保设计的实用性和可靠性。文中引用了大量参考文献,确保设计依据的科学性和权威性。阅读本文有助于读者深入了解汽车起重机液压系统的设计原理和实现方法,为实际工程应用提供有力支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值