CUDA编程
z649431508
知乎ID 那个人姓张 githubID root12321 欢迎交流学习
展开
-
NVCC编译报错 /usr/bin/ld: 找不到 -lopencv_imgcodecs 解决方案
Opencv和cuda程序混编过程中,编译报错,出现/usr/bin/ld: 找不到 -lopencv_imgcodecs collect2: error: ld returned 1 exit status主要原因是libopencv_imgcodecs.so这个链接没有建立完善。解决方案:命令行执行:locate libopencv_imgcodecs.so显示:/usr/li...原创 2019-07-21 11:26:44 · 3015 阅读 · 1 评论 -
利用TensorRT实现神经网络提速(读取ONNX模型并运行)
前言在我这里的实验结论表明,在FP32的精度下,使用TensorRT和不使用TensorRT在GPU上运行的速度比大概为3:1,也就是在我这个模型为前提条件下,TensorRT在GPU端使我的模型速度提升了3倍(不同模型不同显卡不同构架提升速度不同)。TensorRT具备的功能目前TensorRT的最新版本是5.0,TensorRT的发展其实已经有一段时间了,支持转化的模型也有caffe、t...转载 2019-08-09 17:18:42 · 4609 阅读 · 1 评论