一 安装visual studio2019
二 安装opencv 参考win10安装opencv
三 cuda11.0安装
1 打开官网(https://developer.nvidia.com/cuda-toolkit-archive),选择11.0
2 运行安装包,选择自定义安装(第一安装可以全选)
3 路径选择的是默认位置,后面一路默认就OK,安装成功关闭。
4 安装结束后,右键 我的电脑–>属性–>高级系统设置–>环境变量,系统变量中已经加入了cuda的两个路径。
5 在系统变量中加入下面的路径,点击确定.
CUDA_BIN_PATH: %CUDA_PATH%\bin
CUDA_LIB_PATH: %CUDA_PATH%\lib\x64
CUDA_SDK_PATH: C:\ProgramData\NVIDIA Corporation\CUDA Samples\v11.0
CUDA_SDK_BIN_PATH: %CUDA_SDK_PATH%\bin\win64
CUDA_SDK_LIB_PATH: %CUDA_SDK_PATH%\common\lib\x64
6 在系统变量path中加入下面的的变量.
%CUDA_BIN_PATH%
%CUDA_LIB_PATH%
%CUDA_SDK_BIN_PATH%
%CUDA_SDK_LIB_PATH%
7 测试
打开cmd输入nvcc -V
cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0\extras\demo_suite
执行bandwidthTest.exe
执行 deviceQuery.exe
四 cudnn安装
1 官网下载(https://developer.nvidia.com/cudnn)
2 将解压文件里面的bin、include、lib文件夹里面的文件全部复制到CUDA安装目录C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0下对应的bin、include、lib里
参考:win10安装cuda
win10 安装Cuda11.0 + cudnn + pytorch
三 tensorrt7.1.3.4配置与测试
1 官网下载tensorrt7安装包
注:文件名TensorRT-7.1.3.4.Windows10.x86_64.cuda-11.0.cudnn8.0.zip
2 添加环境变量
将TensorRT-7.0.0.11.Windows10.x86_64.cuda-10.0.cudnn7.6\TensorRT-7.0.0.11\lib 加到环境PATH中(根据自己路径)
3 解压下载好的文件,复制lib目录下的dll文件到cuda的bin下
注: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin [根据自己的cuda安装路径即可]
4 安装uff和graphsurgeon
pip install graphsurgeon-0.4.1-py2.py3-none-any.whl
pip install uff-0.6.5-py2.py3-none-any.whl
5 VS 2019配置TensorRT并测试
找到sample_mnist.sln,用vs2019打开
右键选择属性进行配置
具体配置如下:
在库目录配置tensorrt lib,在包含目录配置include目录
为了防止后面执行exe操作闪退,添加getchar()到main函数下(亲测不加会卡)
编译
编译成功后,会在 TensorRT-7.1.3.4.Windows10.x86_64.cuda-11.0.cudnn8.0\TensorRT-7.1.3.4\bin路径下生成文件sample_mnist.exe
下载测试数据(运行图中的py文件)
注:可能会出现urllib.error.HTTPError: HTTP Error 503: Service Unavailable,用浏览器手动访问数据集网站,可以正常访问,于是就尝试运行几次代码,然后就成功了。
最后运行sample_mnist.exe 测试结果
参考:Win10+ VS2017+TensorRT 7.0 安装
基于TensorRT的YOLO(V3\4\5)模型部署
四 win10+tensorrt+yolo部署(主要是根据编译时出现的问题来记录)
项目地址:tensorrt跨平台部署
右键配置第一个程序属性,添加tensorrt路径
没有配置可能出现以下的问题:
添加opencv路径
没有配置可能出现以下的问题:
修改算力值,这个要根据显卡支持的算力来改,2070super支持75
c++17报错解决
在右键属性配置种把test编译成exe ,detect编译成动态库,然后把test设成启动项
未设置出现报错: