- 博客(4)
- 资源 (2)
- 收藏
- 关注
原创 手把手教你使用tensorrt layer api组装scaled yolov4
概要经过几年的飞速发展,pytorch已经成为了深度学习研究和开发人员喜欢的深度学习框架, 但作为pytorch推理后端的C++ libtorch推理效率一直不高,很多工程师喜欢通过pytorch–>onnx–>tensorrt实现模型的转换和部署,但让人苦恼的是,由于pytorch版本的不一致,导致使用torch onnx转换过程总是BUG重重。本博客将讲述一种终极解决方案,即通过python保存pytorch模型参数文件,然后调用tensorrt layer api方式手动组装网络,这样就
2021-01-24 12:13:50 1204 3
原创 全卷积网络中预测部分的softmax操作原理简析
概要现在目标检测网络有采用全卷积结构进行预测的趋势,采用该结构能够1)大幅降低参数数量(全连接参数数量巨大),2)适配任意尺度输入,3)精度上也没有显著降低 等优点。这两天在研究SSH: Single Stage Headless Face Detector, 分析了预测模块中的结构,为什么要将(n,c,w,h)reshape成(n,2,c/2w,h)这一细节,话不多说,进入正题。简析以s...
2018-12-21 19:53:15 1158 2
原创 如何在Linux下gdb Caffe
一般在Caffe中添加自己编写的layer之后需要Debug,本文简要描述下Linux下Caffe的gdb方法:1.编译:在caffe 工程Makefile.config,反注释掉:DEBUG := 1,退出重新编译caffe2.设置:如果是cpu模式下调试,在solver.prototx里将solver_mode:设置为CPU,不然的话进入gdb里是定位不到layer.cpp中的断点的3....
2018-11-07 15:16:37 240
原创 CUDA和FFMPEG硬件解码视频流
本文主要讲述了通过FFMPEG获取H264格式的RTSP流数据(也可以获取本地视频文件),并通过CUDA进行硬件解码的过程。其他博客给出的教程要么只是给出了伪代码,非常的模糊,要么是基于D3D进行显示,使得给出的源码非常复杂,而无法看出CUDA解码的核心框架,而本文将其他非核心部分剥离出去,视频播放部分通过opencv调用cv::mat显示。当然本博客的工作也参考了其他博客的内容,CSDN上原创的东
2017-09-05 00:03:55 22537 15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人