Rainbow Sea
码龄5年
关注
提问 私信
  • 博客:19,149
    19,149
    总访问量
  • 31
    原创
  • 48,923
    排名
  • 224
    粉丝
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:湖北省
  • 加入CSDN时间: 2020-03-03
博客简介:

qq_46463876的博客

查看详细资料
  • 原力等级
    当前等级
    3
    当前总分
    300
    当月
    17
个人成就
  • 获得108次点赞
  • 内容获得25次评论
  • 获得192次收藏
  • 代码片获得649次分享
创作历程
  • 5篇
    2025年
  • 1篇
    2024年
  • 25篇
    2023年
成就勋章
  • 入选《Python领域内容榜》第15名
TA的专栏
  • C++学习
    3篇
  • C++STL 
    4篇
  • PCL点云识别
    1篇
兴趣领域 设置
  • 人工智能
    opencv计算机视觉机器学习深度学习tensorflow图像处理数据分析
创作活动更多

开源数据库 KWDB 社区征文大赛,赢取千元创作基金!

提交参赛作品,有机会冲刺至高2000元的创作基金,快来参与吧!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

自定义实现C++拓展pytorch功能

但是在Windows平台下不知道为什么会报错找不到包,或者找不到函数,很奇怪,但是正常运行没有任何问题。或pip install .
原创
发布博客 前天 22:01 ·
192 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

通过Setuptools和pybind11丝滑实现python调用C++

【代码】通过Setuptools和pybind11丝滑实现python调用C++
原创
发布博客 前天 09:44 ·
164 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

MindSpore训练并测试UNet

pytorch风格大致类似,nn.Cell对应pytorch中的nn.Module注意MindSpore卷积,如果存在padding,需要设置pad_mode='pad'import osreturn outreturn out。
原创
发布博客 2025.03.26 ·
209 阅读 ·
8 点赞 ·
0 评论 ·
5 收藏

UNet-PTQ量化部署(二)

对模型采用混合精度量化的目的主要是为了提升速度的同时,避免模型因为INT8量化造成精度下降比较严重的问题。通过对模型的结构进行敏感层分析,将精度下降较多的层保持更高精度。网址进行可视化,对比一下量化前后的模型结构,可以看到在需要量化的部分插入了很多量化和反量化节点。在转engine时,将mix_type设置为True,同时将量化参数设为int8。进行校准的数据集与训练时候的dataloader写法类似。
原创
发布博客 2025.03.20 ·
358 阅读 ·
7 点赞 ·
0 评论 ·
7 收藏

UNet-PTQ 量化部署(一)

Visio Studio尽量安装2019版本,不然会出现报错如果报错AttributeError: module 'distutils' has no attribute '_msvccompiler',可以将setuptools版本降低至72.1.0除此以外如果仍然遇到了错误(默认安装默认pip install onnxruntime-gpu==1.18.1安装的版本不一定对应):解决办法:其他的库自行安装即可,注意一定要安装GPU版本的,否则使用的是CPU。
原创
发布博客 2025.03.20 ·
1031 阅读 ·
12 点赞 ·
0 评论 ·
8 收藏

opencv+WLS进行双目视觉测量进

第一个就是opencvcontribuild的编译,需要使用cmake进行,直接编译source,网上有教程,注意如果最后想编译成一个opencv.lib需要勾选buildonetgarget。
原创
发布博客 2024.03.20 ·
596 阅读 ·
2 点赞 ·
1 评论 ·
5 收藏

TensorRT部署U_Net

数据后处理主要是将输出的结果(1,4,800,800)的张量通过对每个点的四个特征值的大小进行比较,找出最大值,0代表无缺陷,1带边第一类缺陷,2代表第二类缺陷,3代表第三类缺陷,同时建立他们之间的映射关系,0映射黑色,1映射红色…数据后处理这块主要遇到了两个问题,第一个是从显卡中转运数据时间太长,第二个是libtorch中矩阵张量的计算考虑转移到GPU进行,看能否缩短计算时间,经过测试并不行,涉及到libtorch中无法调用cuda的一些解决办法。普通内存的指针,开辟在堆区,逻辑地址。
原创
发布博客 2023.12.27 ·
1376 阅读 ·
19 点赞 ·
1 评论 ·
26 收藏

U_NET 网络onnx部署

这里边主要踩坑点,第一个是Mat和libtorch中的Tensor并非连续存储,进行数据转换的时候一定要注意,第二个是转换RRRGGGBBB的时候进行了正则化,对每个通道进行单独计算,可以采用opencv的库函数进行,libtorch的部署参考网上教程,注意添加环境变量后记得重启生效,不重启一般报错缺少dll。
原创
发布博客 2023.12.22 ·
1197 阅读 ·
9 点赞 ·
0 评论 ·
13 收藏

Tensorrt加速部署yoloV5 7.0分割算法

主要文件结构如上图,cpp文件最后一个没有什么作用,源码会进行公开不浪费大家的积分下载;engine可以通过python源码进行导出,源码下载可以自行搜索导出当时可以查看之前的tensorrt部署有详细的过程。
原创
发布博客 2023.12.13 ·
682 阅读 ·
9 点赞 ·
1 评论 ·
10 收藏

cuda计算矩阵的乘法

【代码】cuda计算矩阵的乘法。
原创
发布博客 2023.12.07 ·
413 阅读 ·
8 点赞 ·
0 评论 ·
8 收藏

onnx转成engine C++实现

【代码】onnx转成engine C++实现。
原创
发布博客 2023.11.30 ·
676 阅读 ·
9 点赞 ·
0 评论 ·
9 收藏

通过cuda核函数实现图像的缩放以及等比例缩放

有很大一部分借鉴了github开源代码,对其进行了微调。
原创
发布博客 2023.11.23 ·
628 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

CUDA计算二维矩阵的加法

CMakeLists.txt文件的编写。
原创
发布博客 2023.10.20 ·
231 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

Linux下yolov5s+TensorRT C++检测的实现

( 1 ) 数据前处理时间太长,三个for循环,神奇的地方是将缩放图片放在主函数for循环里面时间就是20ms左右,但是放在for循环外侧,就是4ms左右,比较费解。(3)TensotRT的模型文件不能跨平台使用,而且与cuda版本和cudnn的版本、TensorRT的版本严格对应,在不同的环境下生成的engine文件可能会有问题。(2)在安装cuda驱动的时候总是会报错,换一种run的方式,除此以外,如果已经安装了Nvidia的驱动,安装的时候就不要勾选了。(3)CMakeLists.txt文件。
原创
发布博客 2023.10.17 ·
230 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ubantu 20.04安装英伟达显卡驱动

输出Failed to initiate NVML。
原创
发布博客 2023.10.12 ·
291 阅读 ·
0 点赞 ·
2 评论 ·
0 收藏

TensorRT部署推理yolov5s,完整代码和整个流程

主要是使用TensorRT推理部署yolov5sV6.1的过程中遇到的一些问题和记录
原创
发布博客 2023.10.08 ·
737 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

手写实现vectorC++

typename vector::value_type&前面必须添加typename,当函数声明或定义在类模板之外时,需要使用 typename 关键字来指示 value_type 是一个类型。里面的几个问题,重载=号返回引用。还有模板类没办法分文件编写。
原创
发布博客 2023.09.06 ·
316 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

几种排序算法

示例代码(C++)
原创
发布博客 2023.07.19 ·
78 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大根堆(大顶堆)代码示例

【代码】大根堆(大顶堆)代码示例。
原创
发布博客 2023.07.18 ·
370 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

C++部署yolov5s.onnx并使用GPU进行加速

我下载的是1.13.1GPU版本,VS2022,cuda11.6,cudnn8.6.0,仅供参考。除此之外关于cuda也要注意添加一些路径保证cuda能正常启用。其他关于opencv的配置属性可以查阅其他资料。
原创
发布博客 2023.05.15 ·
2058 阅读 ·
6 点赞 ·
5 评论 ·
30 收藏
加载更多