自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Nonentity never give up ? neuer : loser

一个不知道怎么做cv算法的cv算法攻城狮

  • 博客(24)
  • 问答 (1)
  • 收藏
  • 关注

原创 pytorch->onnx->trt 踩坑记录

ERROR: ModelImporter.cpp:296 In function importModel: [5] Assertion failed: tensors.count(input_name)问题原因:pytorch版本为1.4.0,pytorch版本过高引起的onnx解析问题.(据悉这个解析问题会发生在trt5.0-6.0,trt7.0不会出现,详见trt6转torch1.2以上...

2020-04-30 11:50:46 7242 4

原创 SegDecNet的多GPU数据同步训练 代码改动记录

论文:Segmentation-Based Deep-Learning Approach for Surface-Defect Detection环境:python3.5, cuda10 ,cudnn7.6 , tensorflow1.13参考:https://blog.csdn.net/jinxiaonian11/article/details/94316567记录原因:SegDecN...

2020-04-20 09:54:51 686

原创 ubuntu16.04+cuda9.2+tensorflow-gpu1.8.0+torch1.3.0 问题记录

遇到的问题1.显卡驱动显示正常,但是pytorch和tensorflow-gpu都显示无法寻找到显卡设备问题:问题解决:1.显卡驱动显示正常,但是pytorch和tensorflow-gpu都显示无法寻找到显卡设备问题:nvidia-smi # 显示正常lspci | grep vga # 显示正常但是,pytorch和tensorflow寻找不到设备,即torch.cuda.i...

2019-11-04 19:58:40 422

原创 TensorRT5.1.5.0入门 TensorRT头文件学习

目录结构NvInfer.hNvInferPlugin.h简介使用方法具体细节支持的层读取细节其他NvUtils.h简介使用方法具体细节NvCaffeParser.h最近时间宽裕,准备学习一下tensorRT的头文件。TensorRT-5.1.5.0includeNvInfer.hNvInferPlugin.hNvCaffeParser.hNvOnnxConfig.hNvOnn...

2019-08-17 10:43:33 5274 6

原创 TensorRT5.1.5.0 实践 onnx-TensorRT的自定义op

以pytorch转TensorRT为例,进行自定义op的pipeline的整理。文章目录pytoch 转 onnx 过程中扩展自定义oponnx 转 tensorRT 过程中扩展自定义op流程细节学习对自定义op:InstanceNormalization的详解InstanceNormalizationPlugin.hppInstanceNormalizationPlugin.cppbuilti...

2019-08-13 17:08:07 4828 3

原创 python面试积累: 贝壳找房“采木头,锯子、斧头”问题

锯子和斧头轮流砍树问题: 第一行输入树的个数 n, 接下来的 n 行,每行分别输入三个数 a、b、c,分别代表用锯子和斧头砍该棵树的时间,以及换工具砍树所需要的时间。现在手上是斧头,问看完这些树,最短需要多长时间。输入:320 40 2010 4 2590 100 5输出:139Explanation:第一棵树用斧头砍(40),第二颗树还用斧头(4),第三棵树,换成锯子(5 + 9...

2019-08-11 16:10:35 410

原创 tensorRT 5.1.5.0 工作总结

Caffe-tensorRTONNX-tensorRT环境:Ubuntu 16.04,TensorRT 5.1.5.0,python3.5,gcc 5.4 ,torch 1.1.0,torchvision 0.2.2,更新到20.19.8.9的onnx-tensorrt需求:onnx-tensorrt的根本需求是实现pytorch模型的tensorRT加速,而tensorRT现今不直接支...

2019-08-09 15:14:28 2192

原创 Pytorch1.1.0 入门 自定义op(python)

nn.Parametertorch.nn.Parameterm,在看过很多博客的时候发现了一个用法self.v = torch.nn.Parameter(torch.FloatTensor(hidden_size)),首先可以把这个函数理解为类型转换函数,将一个不可训练的类型Tensor转换成可以训练的类型parameter并将这个parameter绑定到这个module里面(net.param...

2019-08-08 18:10:16 6348 1

原创 tensorRT5.1.5.0实践 EfficientNet+Pytorch的转换尝试即准确度测试

更新到2019.8.5参考EfficientNet-Pytorch.文章结构1. 翻译总结内容About EfficientNetAbout EfficientNet PyTorchUsage1. 翻译总结模块包含EfficientNet的op-for-op的pytorch实现,也实现了预训练模型和示例。这个代码是简单,而且高度可扩展的(extensible),并且容易集成到自己的项目...

2019-08-06 12:01:05 3710 7

原创 TensorRT5.1.5.0入门 自定义层 IPlugin & IPluginV2的对比(C++)

最近研究 TensorRT的自定义曾,尝试的使用了自定义的FC层FC层和Upsample层Upsample层之后,重新回去看开发者手册,在此记录。  自己的理解,TensorRT的自定义层机制是有两个方法的,一种基于基类IPlugin,另一种是基于基类IPluginV2,从字面意思上来看IPluginV2就是最新版本。  IPlugin类的方法,是通过自己编写IPlugin的派生类IPlugi...

2019-07-30 13:31:37 4246

原创 TensorRT5.1.5.0实践 基于IPluginV2类的自定义层的用法

挖坑

2019-07-30 13:30:00 4404 2

原创 Onnx EfficientNet网络转onnx格式出现的问题记录

环境: ubuntu 16.04 python 3.5 torch 1.0.0 GTX1080拿到同事训练好的torch模型,想要保存为onnx格式,为以后转TensorRT做准备。代码就几行,torch.onnx定义的方法:import torchfrom torch.autograd import Variablefrom efficientnet import efficientn...

2019-07-26 15:49:13 4616 1

原创 TensorRT5.1.5.0 实践 Pytorch2Onnx ,Onnx2TensorRT(python)

TensorRT5.1.5.x的关于onnx的demo只有两个,一个是c++的introductory_parser_samples,一个是python的introductory_parser_samples。参考了各方资料今天自己基于mnist写了个实例。环境: Ubuntu 16.06,python 3.5.2,torch 0.4.1, onnx 1.4.0 ,TensorRT 5.1.5...

2019-07-23 14:07:48 4846 4

原创 TensorRT5.1.5.0 实践 Doinference过程的探究(python)

挖坑

2019-07-20 12:25:54 6958 19

原创 TensorRT5.1入门 Object Detection With The ONNX TensorRT Backend In Python(python)

很快填坑

2019-07-18 14:03:53 1174

原创 TensorRT5.1入门 introductory_parser_samples

稍后更新

2019-07-18 11:12:50 637

原创 TensorRT 5.1.5.0入门 Pytorch & ONNX

目录demo介绍流程问题demo介绍这个demo是在线训练了mnist的网络,然后直接用torch的nn.Module.state_dict()方法把weights取出来,填充给builder创建的trt格式的network,然后利用这个被填充完weights的network创建engine,进行推断。这个demo没有涉及到pytorch从文件中读取weights的问题。流程 # ...

2019-07-17 17:49:01 2776

原创 TensorRT5.1实践 自定义的Upsample层的方法

记录修改官方提供的trtexec,加入upsample层,跑检测网络的实践过程。接到一个类似yoloV3的检测网络,主要需要处理的是upsample自定义层。查询了一些资料,在github上下载了一些工程,终于是跑通了一个检测前馈时间的实例(还没有进行准确度测试)。...

2019-07-08 16:56:17 6178 4

原创 TensorRT5.1实践 自定义的FC层的方法

enqueueFC的enqueue在头文件中是这么定义的virtual int enqueue(int batchSize, const void* const* inputs, void** outputs, void* workspace, cudaStream_t stream) override;batchSize: int类型的batchSizeinputs/outputs:...

2019-07-04 09:27:34 1843

原创 TensorRT5.1入门 trtexec

Introduction在TensorRT的sample在成功make之后,/bin文件下就会出现trtexec这个可执行文件.在Developer Guide中已经表明,trtexec是对网络进行benchmark的工具,同时可以输出该model优化后生成的串行化(serialized)engine.Related Work工作任务是测试各种网络的前馈时间,而trtexec恰好是工具.但是...

2019-06-28 16:15:47 7869 3

原创 TensorRT5.1入门 samplePlugin

FCPlugin类:继承IPluginExt类.第一个构造函数FCPlugin// 用于build,对mKernelWeights和mBiasWeights的check和内存分配(传入的Weight类型的weights存储了这两个值,其中Weight类包含权重的type,value和count)FCPlugin(const Weights weights, int nbWeights, ...

2019-06-28 15:05:04 2112 6

原创 TensorRT5.1入门 sampleSSD

1.PPM格式图像知识来源:PPM文件格式详解(侵删,用作学习积累)  PPM(Portable Pixmap Format)是源自PBM(位图bitmap,仅有黑与白,没有灰)和PGM(grayscale map,灰度图),PPM是通过RGB三种颜色显现的图像(pixmaps).  这三种图,无论哪种图像文件都是通过2个字节[magic number]来表明文件格式的类型以及编码方式(AS...

2019-06-24 16:25:50 2353 1

原创 Ubuntu16.04配置Caffe——Opencv3.1安装及Bug解决

环境:Ubuntu16.06 ,GTX 1080,CUDA 9.0,Cudnn 7.5.1 ,OPENCV 3.1.0(Deb)为了配置Caffe,为了以后着想,就一定要安装OpenCv。这是一个Caffe完整安装教程:传送门,大神写的非常清楚,在这里借鉴一下。这里只是想记录一下安装Caffe过程中,安装Opencv3.1.0期间出现的问题。(以下是传送门网址的原版叙述,侵删)一、下载...

2019-06-21 17:40:02 968

原创 TensorRT安装 & 环境配置

TensorRT安装&环境配置环境:ubuntu14.04, Tesla P4, Python3.4, Cuda8.0, Cudnn7.1.3 概述:从装有Ubuntu14.04和Python3.4的服务器上实现环境的配置。本文记录了在配置各个必要组件的环节中遇到的问题。1. 配置Nvidia驱动服务器显卡是Tesla的P4显卡,在2019.6.13这一天Nivida官网适用L...

2019-06-13 19:30:30 2513

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除