1. Tensorrt安装
最近考虑对已经训练好的Pytorch模型进行Float16优化,以达到部署时inference减小耗时,显存开销。可是很多博客写的乱七八糟,我这里整理一份自己安装的过程。供大家参考。
首先我们需要查看自己服务器或者GPU是什么版本的驱动,然后才可以安装对应版本的Tensorrt
1.1 查看cuda版本
[~]$ nvcc -V
nvcc: NVIDIA ® Cuda compiler driver
Copyright © 2005-2017 NVIDIA Corporation
Built on Fri_Sep__1_21:08:03_CDT_2017
Cuda compilation tools, release 9.0, V9.0.176
下载 Tensorrt6.x
注:下载时,需要注册Nvidia的developer的账号,填写对应的开发者调查问卷信息。不一定非要下载6.x版本,目前已更新到7.x,不过考虑环境兼容问题,所以先选择6.x版本。
1.2 安装
pip install 'pycuda>=2017.1.1'