NVIDIA-Tensorrt 之 前向推理耗时不稳定的解决方法

应用场景:

系统:Windows 10 x64
硬件:分别使用Nvidia 3060 laptop、Nvidia 3070、Nvidia 3070 Ti
驱动:5xx
cuda:11.x
平台:Halcon、PaddlePaddle
任务:随机执行一次推理,但要求耗时稳定


问题描述

  • 在上述应用场景下,随机执行推理的耗时很不稳定,30ms 至 100ms+不定;
  • 如果保持连续间隔40ms的推理频率,时间又比较稳定30ms+;
  • 规律就是,间隔时间长去进行推理,那么这次的推理耗时特别长,耗时会是连续推理的三、四倍;

尝试解决:

  • 各种更换硬件的组合方式,没有能够解决这个问题;

  • 各种更换CUDA组合方式,没有能够解决这个问题;

  • 分页内存设置,没有能够解决这个问题;

  • 单独开启一个线程,以很小的固定间隔时间推理一张固定的图片,在这个基础上再去推理我们想要处理的任务。该方法有一定的效果,但是不理想,还是不够稳定,单张图片的推理时间还是波动一倍左右。

  • 根据同事反馈使用1080Ti显卡,同样的程序却没有这个问题存在;


原因分析:

官方的人员回复:
1 间隔推理可能会导致显卡降频并且会持续一些时间,建议开一个空内核跑着可以维持高频率,Samples中有,但是我没有找到;
2 建议设定固定频率,这个应该简单一些;
3 多久降?降多少?为什么?…不得而知


解决方案:

锁定GPU时钟频率(实测有效):

  • 第一步 使用 nvidia-smi -q -d SUPPORTED_CLOCKS 查询GPU支持的最高频率,如下图所示为 7001 MHz
nvidia-smi -q -d SUPPORTED_CLOCKS

 
 
  • 1

查询主频

  • 第二步 设置锁定评率 nvidia-smi -lgc 7001 设置成功后的结果如下图所示:
nvidia-smi -lgc 7001

 
 
  • 1

设置主频

  • 第三步 NVIDIA 显卡设置
低延时模式,设置为 超高

 
 
  • 1

在这里插入图片描述

- 电源管理模式,设置为 最高性能优先

 
 
  • 1

在这里插入图片描述


  • 第四步 Batchsize=1 随机间隔时间进行推理,测试推理耗时,此时应该就很稳定了!
### 回答1: 这个命令是用来升级 NVIDIA TensorRT 的,它是一种高效的深度学习推理引擎,可以加速模型的推理速度。在安装之前,你需要确保已经安装了适合你系统版本的 NVIDIA CUDA 和 cuDNN。如果你想升级 TensorRT,可以使用这个命令。需要注意的是,你需要先安装 NVIDIA CUDA、cuDNN 和 TensorRT 的依赖库才能使用这个命令。 ### 回答2: pip install --upgrade nvidia-tensorrt 是一个用于安装或升级NVIDIA TensorRT库的命令。 NVIDIA TensorRT是一个用于高性能深度学习推理的加速库。它可以优化和加速深度学习模型的推理过程,提供快速、高效的推理性能。使用TensorRT可以在不降低精度的情况下,大大减少模型的推理时间,使得在生产环境中能够更快地完成推理任务。 要使用pip安装或升级nvidia-tensorrt,需要先确保已经安装了pip工具。然后可以在命令行中运行该命令。该命令将会从pip的源中下载最新版本的nvidia-tensorrt,并安装或升级到本地环境中。 这个命令的作用主要有两个方面: 1. 安装nvidia-tensorrt:如果本地环境中没有安装过nvidia-tensorrt,该命令将下载最新版本的nvidia-tensorrt,并将其安装到本地环境中。 2. 升级nvidia-tensorrt:如果本地环境中已经安装了旧版本的nvidia-tensorrt,该命令将会检查是否有新版本可用,并下载最新版本的nvidia-tensorrt进行升级。 需要注意的是,该命令需要联网才能下载最新版本的nvidia-tensorrt。在执行该命令之前,可以先通过`pip install pip -U`命令升级pip工具本身,以确保使用最新的pip版本。 总之,通过运行pip install --upgrade nvidia-tensorrt命令,可以方便地安装或升级NVIDIA TensorRT库,以提升深度学习模型推理的性能。 ### 回答3: 通过在终端中运行"pip install --upgrade nvidia-tensorrt"命令,可以安装或升级NVIDIA TensorRT库。NVIDIA TensorRT是一个高性能的深度学习推理引擎,可以优化和加速训练好的深度学习模型的推理过程。 在安装或升级过程中,pip工具会自动检查TensorRT库的最新版本,并下载安装相应的软件包。安装或升级TensorRT库的过程可能需要一些时间,这取决于网络连接和计算机性能。 通过安装或升级TensorRT库,我们可以获得以下几个好处: 1. 提高推理性能:TensorRT库使用高度优化的计算核心和算法,可以加速深度学习模型的推理速度。这对于需要实时或高效推理的应用程序非常有用。 2. 支持多种硬件平台:TensorRT库可以在多种NVIDIA GPU板卡上运行,包括Tesla、Quadro和GeForce系列。这样,我们可以根据需求选择适合的硬件平台。 3. 缩小模型尺寸:TensorRT库可以自动剪裁和优化深度学习模型,以减小模型的尺寸。这对于在移动设备或边缘设备上部署模型时非常有用。 4. 简化部署流程:TensorRT库提供了用于在不同平台上部署深度学习模型的简化工具和API。这使得将训练好的模型部署到实际应用中更加容易。 总之,通过运行"pip install --upgrade nvidia-tensorrt"命令来安装或升级NVIDIA TensorRT库,我们可以获得高性能的深度学习推理引擎,并享受其提供的推理性能优化和部署简化功能。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值