cuda
文章平均质量分 58
AI算法网奇
本人曾是一名普通会计,自学编程和算法,15年封闭苦学,现在是一名资深算法工程师,CSDN博客专家。
本人将多年的工作经验整理出来,从入门知识到高阶技巧,乃至最前沿研究成果,皆有分享,为国内IT行业自强之路,尽个人微薄之力。
展开
-
linux 僵尸进程 关闭看不见的进程
linux 僵尸进程 关闭看不见的进程原创 2023-12-05 20:24:56 · 820 阅读 · 0 评论 -
linux nvcc未找到命令
linux nvcc未找到命令转载 2023-03-17 19:01:53 · 1761 阅读 · 1 评论 -
Assertion failed: cublasStatus == CUBLAS_STATUS_SUCCESS
Assertion failed: cublasStatus == CUBLAS_STATUS_SUCCESS转载 2023-02-19 15:37:45 · 1417 阅读 · 0 评论 -
the lambda is an ‘extended lambda‘ and the flag --extended-lambda is specified
the lambda is an 'extended lambda' and the flag --extended-lambda is specified原创 2023-02-18 13:25:12 · 665 阅读 · 0 评论 -
tensorrt内存释放 笔记
tensorrt内存释放 笔记原创 2022-11-13 20:00:47 · 1983 阅读 · 1 评论 -
“CUDA_CHECK”: 找不到标识符 checkRuntime
“CUDA_CHECK”: 找不到标识符 checkRuntime原创 2022-11-13 19:33:27 · 2233 阅读 · 0 评论 -
Unknown CMake command “cuda_add_library“.
Unknown CMake command "cuda_add_library".原创 2022-11-10 00:54:30 · 2805 阅读 · 2 评论 -
name followed by “::“ must be a class or namespace name
name followed by "::" must be a class or namespace name原创 2022-11-10 00:08:22 · 3001 阅读 · 0 评论 -
dllexport/dllimport requires external linkage
dllexport/dllimport requires external linkage转载 2022-10-17 01:34:43 · 1129 阅读 · 0 评论 -
TensorRT6
TensorRT6原创 2020-03-29 16:15:17 · 3200 阅读 · 0 评论 -
tensorrt expecting compute 7.5 got compute 6.1, please rebuild
expecting compute 7.5 got compute 6.1, please rebuild原创 2022-08-17 23:43:50 · 1466 阅读 · 0 评论 -
c++ TensorRT TRT::Tensor 用法学习笔记
c++ TensorRT TRT::Tensor 用法学习笔记原创 2022-08-09 00:36:58 · 1588 阅读 · 0 评论 -
LNK2001 无法解析的外部符号 cuGetErrorName解决
LNK2001 无法解析的外部符号 cuGetErrorName解决原创 2022-08-06 03:10:51 · 1213 阅读 · 0 评论 -
cudaMemcpy学习笔记
cudaMemcpy学习笔记原创 2022-07-31 00:34:22 · 1692 阅读 · 0 评论 -
Assertion failed: inputs.at(2).is_weights
Assertion failed: inputs.at(2).is_weights转载 2022-07-20 18:07:13 · 1869 阅读 · 0 评论 -
Cuda Error in NCHWToNCHHW2解决
Cuda Error in NCHWToNCHHW2解决原创 2022-07-19 11:37:47 · 1635 阅读 · 0 评论 -
cuda.h: No such file or directory
cuda.h: No such file or directory转载 2022-07-12 19:28:08 · 3124 阅读 · 0 评论 -
The CUDA compiler identification is unknown 解决
TheCUDAcompileridentificationisunknown 解决原创 2022-07-12 11:33:26 · 4539 阅读 · 0 评论 -
gstreamer中如何使用probe(探针)获取帧数据
gstreamer中如何使用probe(探针)获取帧数据转载 2022-07-08 17:45:17 · 3094 阅读 · 0 评论 -
deepstream 预处理结果保存(进入模型前的图片)
deepstream 预处理结果保存(进入模型前的图片)转载 2022-07-08 14:12:38 · 2212 阅读 · 2 评论 -
cuda 排序算法笔记
Thrust是cuda自带的c++库,cuda安装好之后,这个库也默认安装好了。这个库基本是采用类似STL的接口方式,因此对于开发者非常友好,开发者不再需要关注内存与显存相关的问题了。排序入门例子#include <thrust/host_vector.h>#include <thrust/device_vector.h>#include <thrust/generate.h>#include <thrust/sort.h>#incl..原创 2022-03-30 00:52:41 · 2725 阅读 · 1 评论 -
thrust 学习笔记
gather与scatter正好相反:scatter是顺序输入根据map确定撒点输出位置。gather是根据map确定输入元素的位置,输出是按顺序的。如图:具体可以查看 https://blog.csdn.net/seamanj/article/details/82976687————————————————版权声明:本文为CSDN博主「Scott f」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.cs..转载 2022-03-28 01:02:09 · 1566 阅读 · 0 评论 -
TensorRT C++ 批量推理笔记
文中的输出可以支持一个batch_size,不支持多个batch_size,批量预测还在调研void* buffers[2];buffers[inputIndex] = inputbuffer;buffers[outputIndex] = outputBuffer;1. TensorRT 的 C++API使用示例进行推理,需要先创建IExecutionContext对象,要创建这个对象,就需要先创建一个ICudaEngine的对象(engine)。两种创建engine的方...原创 2022-03-26 11:34:10 · 2239 阅读 · 2 评论 -
vs 更换cuda版本笔记
换了一台电脑,vs编译项目时,需要更换cuda版本,vs直接打开项目会报错,更换cuda方法:在project_xxx.vcxproj中更换cuda版本比如查找10.2 替换为11.0 <ImportGroup Label="ExtensionTargets"> <Import Project="$(VCTargetsPath)\BuildCustomizations\CUDA 10.2.targets" /> </ImportGro..原创 2022-03-10 23:00:51 · 2145 阅读 · 0 评论 -
NeuroDetection.cpp 2022.0203
单张图片调用:int main(){ char errMsg[256]; memset(errMsg, 0, 256); //1. 创建模型 //从云平台下载权重文件,只需使用该接口转化一次即可 /*BuildModel("./wts2/16676.wts", "./model/16676.model", 1, errMsg); std::cout << "BuildModel:" << errMsg <<..原创 2022-02-23 00:28:52 · 30 阅读 · 0 评论 -
“nvinfer1::ILogger”: 不能实例化抽象类
修改cuda版本:高级系统设置里面的path变量,可以修改cuda版本:v10.3版本不存在,就自动找v11.0了,nvcc -V打印出来是v11.0版本。“nvinfer1::ILogger”: 不能实例化抽象类tensorrt 7.2.3.7TensorRT-7.2.3.4.Windows10.x86_64.cuda-11.0.cudnn8.1当前cuda版本为10.1...原创 2022-01-18 00:45:21 · 2587 阅读 · 1 评论 -
opencv cuda使用笔记
转cpu: cv::Mat dst; flt_image_out.download(dst); cv::Mat dst_gold; cv::cvtColor(src, dst_gold, cv::COLOR_BGR2RGB);//打印一个Mat矩阵void PrintMat(Mat A){ for(int i=0;i<A.rows;i++) { for(int j=0;j<A.cols;j++) ...原创 2021-12-17 00:46:20 · 3368 阅读 · 0 评论 -
cv::cuda::split 使用
cv::cuda::spliterror:‘split’ is not a member of ‘cv::cuda’…error:‘resize’ is not a member of ‘cv::cuda’……recipe for target ‘all’ faildIncvking “make -j6 -l6” faild…这里可以通过添加对应的cv头文件解决error,比如#include <opencv2/cudaimgproc.hpp>#includ...原创 2021-12-16 23:46:18 · 4400 阅读 · 0 评论 -
nvcc 编译已退出,返回代码为1
nvcc 编译已退出,返回代码为1原因:cuda库目录版本写错了把库目录改对就行了。原创 2021-12-15 00:52:32 · 2755 阅读 · 0 评论 -
TensorRT was linked against cuBLAS/cuBLAS LT 11.2.0 but loaded cuBLAS/cuBLAS
TensorRT was linked against cuBLAS/cuBLAS LT 11.2.0 but loaded cuBLAS/cuBLASLT 10.2原因:TensorRT和cuda版本需要匹配重新下载和cuda版本匹配的版本TensorRT下载页面有选择版本的。原创 2021-12-14 20:46:02 · 5472 阅读 · 3 评论 -
c++ cuda拷贝内存
https://developer.nvidia.com/zh-cn/blog/how-overlap-data-transfers-cuda-cc/分批拷贝:for (int i = 0; i < nStreams; ++i) { int offset = i * streamSize; cudaMemcpyAsync(&d_a[offset], &a[offset], streamBytes, cudaMemcpyHostT..转载 2021-12-11 20:57:45 · 1943 阅读 · 0 评论 -
win10 tensorrt安装 踩坑记录
win10 tensorrt安装下载地址:https://developer.nvidia.com/nvidia-tensorrt-7x-download需要注册,登录。选择跟cuda对应的版本:1. 添加环境变量,比如:PATH:D:\it\TensorRT-7.1.3.4\lib 2. 安装uff和graphsurgeon,下载demo 需要的datacd D:\Software\TensorRT-7.1.3.4\graphsurgeonpip inst...原创 2021-12-10 18:43:56 · 8871 阅读 · 8 评论 -
Window编译Opencv CUDA版
https://blog.csdn.net/qq_30623591/article/details/82084113opencv+CUDA9.1+vs2015环境搭建,编译opencv库,调用GPU加速运算_公子_羽的博客-CSDN博客_opencv 编译cudawindows上编译自己的opencv(含cuda) - 知乎使用OpenCV操作CUDA 图像_jacke121的专栏-CSDN博客...原创 2021-12-10 12:20:03 · 3336 阅读 · 0 评论 -
tensorrt yolov5 批量预测学习笔记
多张图片预测:https://github.com/noahmr/yolov5-tensorrthttps://github.com/enazoe/yolo-tensorrt/blob/c4d72605f83d547081cc30c3b71458001826191d/modules/class_yolo_detector.hppcv::Mat trtInput = blobFromDsImages(vec_ds_images, _p_net->getInputH(),_p_net-&g..原创 2021-12-10 11:24:07 · 4114 阅读 · 0 评论 -
使用OpenCV操作CUDA 图像
void makeJPEG(PyObject* _py_list_src, int idx, int _target_size, bool _crop_to_square, PyObject* _py_list_tgt, bool withGpu) { cv::Mat _resized_mat_buffer; cv::cuda::GpuMat _resized_mat_buffer_gpu; std::vector<uchar> _output_jpeg_buf...转载 2021-12-10 10:37:15 · 2128 阅读 · 0 评论 -
tensorrt优化笔记 版本管理
tensorrt在不同batchsize下的性能对比tensorrt在不同batchsize下的性能对比_大鱼的博客-CSDN博客_tensorrt 多batch原创 2021-12-09 21:00:42 · 1803 阅读 · 0 评论 -
tensorrt 低精度推理
据说TensorRT7实现了尽量低精度运算,还没有使用过。TensorRT5要设置低精度运算的话,可以设置为Fp16或int8的。1 Fp16需要先查询设备是否支持fp16:bool fp16 = builder->platformHasFastFp16();返回true了,才能设置引擎以fp16进行推理。builder->setFp16Mode(true);2 int8if (builder->platformHasFastInt8()) { … ...转载 2021-12-09 12:21:57 · 3012 阅读 · 3 评论 -
cudart64_101.dll not found
TensorFlow-gpu 2.3.0-gpu 匹配的cuda版本为10.1安装的cuda10.2版本,报错:cudart64_101.dll not found有时也报错:cudart64_100.dll not found官方下载地址:cudart64_100.dll free download | DLL‑files.com官方下载地址:cudart64_101.dll free download | DLL‑files.com下载dll后,拷贝到目录转载 2021-12-07 16:11:37 · 1808 阅读 · 2 评论 -
linux Ubuntu20.04子系统 安装cuda教程
linux Ubuntu20.04子系统 安装cuda教程原创 2021-11-01 01:20:18 · 2285 阅读 · 0 评论 -
Google Colab 使用教程(1)
Google Colab免费GPU使用教程(一)一、前言现在你可以开发Deep Learning Applications在Google Colaboratory,它自带免费的Tesla K80 GPU。重点是免费、免费!(国内可能需要tz)这个GPU好像不便宜,amazon上1769刀.二、什么是Google Colab?Colaboratory 是一个 Google 研究项目,旨在帮助传播机器学习培训和研究成果。它是一个 Jupyter 笔记本环境,不需要进行任何..转载 2021-08-08 22:07:25 · 2548 阅读 · 0 评论