szfhy
码龄7年
  • 1,483,942
    被访问
  • 212
    原创
  • 1,808
    排名
  • 207
    粉丝
关注
提问 私信
  • 加入CSDN时间: 2015-08-27
博客简介:

szfhy的博客

查看详细资料
  • 4
    领奖
    总分 689 当月 26
个人成就
  • 获得169次点赞
  • 内容获得115次评论
  • 获得785次收藏
创作历程
  • 11篇
    2022年
  • 1篇
    2021年
  • 2篇
    2020年
  • 32篇
    2019年
  • 51篇
    2018年
  • 11篇
    2017年
  • 40篇
    2016年
  • 96篇
    2015年
成就勋章
TA的专栏
  • TensorRT
    7篇
  • cuda
    3篇
  • ros
    1篇
  • 算法
    33篇
  • 图像处理
    41篇
  • 模式识别与机器学习
    41篇
  • python
    53篇
  • onvif
    2篇
  • c/c++
    20篇
  • FFMPEG
    9篇
  • linux
    24篇
  • 计算机视觉
    19篇
  • DeepLearning
    13篇
  • tensorflow
    6篇
  • opengl
    12篇
兴趣领域 设置
  • 人工智能
    opencv计算机视觉机器学习深度学习神经网络tensorflow图像处理
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Tensorrt 自定义插件的调用顺序及过程

一个自定义插件需要实现两个类,分别继承于class MyPluginDynamic : public IPluginV2DynamicExclass MyPluginDynamicCreator : public IPluginCreator然后使用REGISTER_TENSORRT_PLUGIN(MyPluginDynamicCreator);看其详细定义,也就是将这个插件加入到一个全局链表中,方便trtexec根据op name来查找该插件,这个实现跟ffmpeg中注册编解码器是一个
原创
发布博客 2022.04.17 ·
185 阅读 ·
0 点赞 ·
0 评论

Tensorrt 自定义插件的调用顺序及过程

一个自定义插件需要实现两个类,分别继承于class MyPluginDynamic : public IPluginV2DynamicExclass MyPluginDynamicCreator : public IPluginCreator然后使用REGISTER_TENSORRT_PLUGIN(MyPluginDynamicCreator);看其详细定义,也就是将这个插件加入到一个全局链表中,方便trtexec根据op name来查找该插件,这个实现跟ffmpeg中注册编解码器是一个
原创
发布博客 2022.04.17 ·
185 阅读 ·
0 点赞 ·
0 评论

如何查看TensorRT默认支持的算子(operator)

TensorRT7.0支持的ONNX算子列表https://github.com/onnx/onnx-tensorrt/blob/84b5be1d6fc03564f2c0dba85a2ee75bad242c2e/operators.mdOperator Supported? Restrictions Abs Y Acos Y Acosh Y Add Y And Y ArgMax Y .
原创
发布博客 2022.04.05 ·
473 阅读 ·
0 点赞 ·
0 评论

TensorRT开发踩坑笔记

bindding 数据类型部一致某个输出的数据类型是int, 忽略了,一直当作是float解析,导致错误。虽然int 和 float 占用内存大小是一样的,但是解析方式错误,导致最终的错误,看来对每个bingding做输入输出校验,是很有必要的。 后期做动态转换也是可以解决Int32 *pInt32Buf = reinterpret_cast<int*>output_binding_float.data();...
原创
发布博客 2022.03.28 ·
243 阅读 ·
0 点赞 ·
0 评论

C实现纵横比保持的RGB图像缩放

双线性插值,实现图像scale down, 记个笔记#include "stdafx.h"#include <iostream>#include "stdio.h"using namespace std;int img_down_scale(const unsigned char* src_img, unsigned char* dst_img, int src_width, int src_height, int dst_width, int dst_height)
原创
发布博客 2022.03.20 ·
138 阅读 ·
0 点赞 ·
0 评论

TensorRT自定义插件的实现

对于比较新或者计算OP,tensorrt的响应并没有那么快,这个时候就需要我们自己实现自定义的插件,先开个题吧,后面整理一下代码,再帖上来,不错的链接实现TensorRT自定义插件(plugin)自由! (qq.com)...
原创
发布博客 2022.03.05 ·
117 阅读 ·
0 点赞 ·
0 评论

C++ TensorRT开发笔记

有用的链接NVIDIA工程师的仓库GitHub - zerollzeng/tiny-tensorrt: Deploy your model with TensorRT quickly. 快速使用TensorRT来部署模型参考上述仓库的实现Python成神之路 - xavier平台上YOLOV5的TensorRT加速
原创
发布博客 2022.02.26 ·
2541 阅读 ·
0 点赞 ·
0 评论

TensorRT trtexec 学习笔记

trtexec 实现onnx转tensorrt./trtexec --onnx=test.onnx --saveEngine=test.gie --verbose --dumpLayerInfo --dumpOutput --dumpProfile
原创
发布博客 2022.02.26 ·
371 阅读 ·
1 点赞 ·
0 评论

ONNXRuntime模型推理

直接贴code加载,推理import onnxruntime as ortimport torchimport timeimport cv2import numpy as npdef time_sync(): if torch.cuda.is_available(): torch.cuda.synchronize() return time.time()ort_session = ort.InferenceSession('./semseg.onn
原创
发布博客 2022.02.25 ·
2446 阅读 ·
0 点赞 ·
0 评论

cuda 软硬件相关概念

软件概念thread block grid硬件概念sp sm cuda core
原创
发布博客 2022.02.19 ·
381 阅读 ·
0 点赞 ·
0 评论

cuda 图像处理之sobel边缘检测

贴上来源代码吧,是在linux下调试通过的,包含源码和CMakeLists.txt环境配置配置好cuda pkg_config配置好opencv pkg_config之后的CMakeLists.txt会使用源码#include "cuda_runtime.h"#include <cuda.h>#include <device_functions.h>#include <opencv2/opencv.hpp>#include <iostr
原创
发布博客 2022.02.19 ·
1693 阅读 ·
0 点赞 ·
0 评论

TensorRT int8 calibration table生成及解析

TensorRT int8推理的精度接近fp32, 但是存储空间更小,对memory的带宽消耗也少,同时推理速度也有一定的提升。是一项很重要的技术。跟fp16和fp32不一样,使用int8推理必须先要做calibriation,其实就是再做浮点数定点化的一些操作,然后将一些关键数据保存下来,下次使用时,就不用重新生成了。这些数据会被记录到一个calibration table的文件中。为了生成calibration table需要准备一个calibration dataset, 通常要500-1000个
原创
发布博客 2022.02.12 ·
803 阅读 ·
0 点赞 ·
0 评论

2021-02-20keras basic

from tensorflow.keras import layersfrom tensorflow.keras import initializersimport tensorflow as tffrom keras.models import Sequentialfrom keras.layers import Dense, Flattenfrom keras.layers.convolutional import Conv2D, MaxPooling2Dfrom keras.utils.n
原创
发布博客 2021.02.20 ·
73 阅读 ·
0 点赞 ·
1 评论

cuda 入门(一)

环境配置:安装完cuda之后,查看cuda编译器nvcc能否能够正常工作。第一个Helloworld
原创
发布博客 2020.12.27 ·
187 阅读 ·
0 点赞 ·
0 评论

ubuntu16.04 install ros kinetic

install guidehttp://wiki.ros.org/kinetic/Installation/Ubuntufailed at:sudo rosdep initrosdep updategot error:ERROR: cannot download default sources list from:https://raw.githubusercontent.com/ros/rosdistro/master/rosdep/sources.list.d/20-defa
原创
发布博客 2020.05.14 ·
241 阅读 ·
0 点赞 ·
0 评论

git_ros_dep.zip

发布资源 2020.05.14 ·
zip

opengl保存并加载二进制program

通常情况下,opengl 的shader会被编译成program,然后再将program送到GPU里面去执行。如果我们的应用程序,每次都用源码编译shader,这样效率肯定是不高的,特别是在嵌入式平台上, 性能比较弱的场景下。其实我们可以稍微修改一下我们的程序结构,将编译完的program保存下来,下一次再用的时候,直接加载保存好的二进制program就好了,不必每次都编译,浪费时间。...
原创
发布博客 2019.12.09 ·
838 阅读 ·
0 点赞 ·
0 评论

opengl 显示UYVY422格式的数据--性能提升

前面我们分享过,opengl 显示UYVY422格式的数据我们显示的是视频,每帧数据都copy到GPU中去渲染,图像数据一般是挺大的,copy数据的快慢对整个性能的影响还是很大的。在opengl中copy frame data用到的API是glTexImage2D.其实上文中的用法不太好。每帧图像都要渲染,直接在GPU内部分配一个固定的Buffer,不用每帧都去申请,然后再释放。...
原创
发布博客 2019.11.01 ·
1195 阅读 ·
0 点赞 ·
0 评论

show_uyvy422.zip

发布资源 2019.10.29 ·
zip

opengl 显示UYVY422格式的数据

前面我们分享过如何显示YUV420P的图像,渲染YUV420P数据这此我们分享一下UYVY422格式图像的渲染方法,关于YUV420P和UYVY422的区别,网上有很多图例可以帮大家理解。直接看代码,代码是直接可以运行的。完整代码和资源文件,请访问:https://download.csdn.net/download/szfhy/11940081#include <st...
原创
发布博客 2019.10.29 ·
1949 阅读 ·
3 点赞 ·
5 评论
加载更多