- 博客(7)
- 收藏
- 关注
原创 商汤系列模型使用(二)MMDeploy使用方法(C++ 推理)mmdet、mmocr
进入MMDeploy根目录下# 新建并进入build文件夹# 编译自定义算子cmake \trt" \
2025-08-11 16:51:01
824
原创 商汤系列模型使用(一)MMOCR源码下载、数据及制作、模型训练(预训练权重)、
注意:这是由于我的数据集类相较为单一而命名的,正常情况下应该首先用python脚本获取每一张图像的名字,而后手动填写每一张图像中的文字信息。由于我这个是参考icdar2015制作的,因此我就基于icadr2015的配置文件进行修改。注意1:这里面有一个坑,原始的官方.txt文件当中多加入了一个逗号(修改后再转json)首先转为我们自己下载的.txt文件的格式,后面就按照官方的手册走就好了。该文件文件夹就是我们的数据集,后面训练可以使用此文件夹。将标签文件的.txt文件转换为.json文件。
2025-08-11 09:58:46
901
原创 CUDA编程学习(四)代码编写
build/这是编译生成的目录,通常由系统或构建工具(如CMake/Make)自动创建。包含编译过程中生成的中间文件(如.o目标文件)、临时文件以及最终的可执行文件/库。一般不应手动修改其中的内容。config/存放与构建配置相关的文件,例如:环境变量设置(如CUDA路径、依赖库路径)Makefile或CMake的预设参数(如编译选项、GPU架构版本)第三方库的配置脚本这些文件帮助定制化编译过程,适应不同平台或环境。src/源代码目录,包含工程的主要实现文件:CUDA内核代码(.cu。
2025-06-11 17:54:25
1007
原创 CUDA编程学习(三)VScode配置
进入tensorrt_starter-main/chapter2-cuda-programming/2.3-matmul-basic路径输入bear -- make -j16 (输入错了的话输入 make clean清除)(4)设置tasks.json:task.json文件的主要作用是在每次gdb调试的时候自动更新程序数据。运行:bear -- make -j16程序后会生成compile_commands.json。①CTRL+SHIFT+P (也可以在搜索栏目输入<),出现以下界面。
2025-05-20 10:03:22
847
原创 CUDA编程学习(二)win11+wsl2+cuda+tensorRT环境配置
由于wsl和windows共用显卡驱动,因此仅需要安装cidatoolkit和cudnn,conda命令安装后虽然也可以用cudnn,但是不是完整版,不能编译。(5)在任意界面进入《在终端打开 》即windows terminal,win11自带,win10需要去应用商店下载。(2)根据要求TensorRT要求cuda的最高版本为11.8,本文电脑最高支持的cuda版本为12.4。(2)安装方法:打开windows自带的应用商店,搜索ubuntu,选择版本后自己打开。
2025-05-20 10:02:27
899
转载 CUDA编程学习(一)基础理论
④由于throughput非常的高,所以相比与CPU,cache miss(在缓存中没有找到数据)所产生的latency对性能的影响比较小一旦fetch好了数据以后,就会一直连续处理,并且很少cache miss。注:由于CPU处理的大多数都是一些复杂逻辑的计算,有大量的分支以及难以预测的分支方向,所以增加core的数量,增加线程数而带来的throughput的收益往往并不是那么高。• ID(Instruction decode): 把取出来的指令给解码成机器可以识别的信号。
2025-05-20 10:01:14
71
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅