自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 DQN探索超参

ps:年前买了本深入浅出强化学习的书,也是囫囵的看了一遍,找不到合适的切入点,要么太难;要么太简单,感觉不入手也可。那百度的强化学习打卡营的好处就是有人帮你理清了一遍,再看感觉,‘嗯,我知道你’。 话不多述,上主题,今天就是想办法找到一些模型的超参数,看看怎么会更好的结果 优化框架:parl 的...

2020-06-27 09:39:42 55 0

原创 算法上的创新点大搜罗

背景 最近离职在找工作,开始以为介绍下做的工作,然后大家过来评估下,然后可以开心的继续炼丹以及顺便做做工程。然鹅,我发现好多人更关注“遇到了哪些难题,咋解决的”这种情况。被问的我一脸懵逼,自始至终没有太关注这些点,不管怎么说,还是总结一下好了。 L2 loss的修改 年龄回归,当时试验了许多los...

2020-02-29 12:16:23 372 0

原创 tx2使用说明

背景 在T4上运行的工程迁移到tx2上,相同的工程,不同的环境,势必遇到几个坑,遂记之。 出现的问题 1. python版本 可在cmake的时候通过超参数指定,cmake -DPYTHON_EXECUTABLE=/usr/bin/python .. 2. openGL对glew等依赖包 安...

2020-01-10 20:21:48 312 0

原创 在外面结束循环体

需求背景 核心函数相当于一个while循环,不停的运行。现在有个需求,是在启动此功能后,能从外部停止其运行。 只奈学术不精,没能找到c++或c的原生实现;或者退而求其次存在某个设定固定内存地址,然后进行数据读写的方式;最后迫不得已,只能想到修改环境变量或者硬盘文件的方法。 修改环境变量 c++修...

2019-11-21 15:35:26 42 0

原创 一文玩转pytorch转onnx-tensorRT ——(B)pytorch转onnx

说明 pytorch转onnx全打通,就可以使用onnx的全产业链了。实际上,pytorch转onnx会遇到一些小问题,比如我遇到的upsample,找的资料蛮多的,但是归根结底有效的方法,是升级pytorch1.1到1.2,顺带提一句,更新到pytorch1.2,使用清华源加速到方法sudo...

2019-11-15 13:58:27 1087 0

原创 一文玩转pytorch转onnx-tensorRT ——(C)测试onnx转tensorRT

说明 前文讲到了如何在onnx注册自定义层,以便onnx parsing时找到所对应的层。 在示例demo前,贴出遇到的问题 问题: ONNX and tensorRT: ERROR: Network must have at least one output 开始当作正常bug去...

2019-11-15 12:55:29 1806 2

原创 一文玩转pytorch转onnx-tensorRT ——(A)onnx转tensorRT

说明 onnx和tensorRT是分开的,onnx像是prototxt和weight的打包在一起的东西。所以由onnx转到tensorRT下,还需要让onnx能搜索到(或parsing)所对应的层。 caffeparsing有注册自定义层的函数,而onnx没有,下面会就onnx-tensorRT...

2019-11-15 11:40:05 1143 0

原创 一文玩转pytorch转onnx-tensorRT ——(3)测试自定义的tensorRT层

层已经写完了,如何测试呢。可以直接去看下面的代码 代码说明: 如何编译在开头写出来了,直接用就可以了,当然不是。 首先是cub库,它是cuda函数的__share__函数的打包版。我的库放在了/home/user/package/cub-1.8.0下 用到了common,是te...

2019-11-15 10:59:52 817 1

原创 一文玩转pytorch转onnx-tensorRT ——(2)使用pluginV2分配的显存

说明 上文《一文玩转pytorch转onnx-tensorRT ——(1)创建tensorRT层》说到getWorkspaceSize会分配一些显存,和普通的cuda函数不一致的地方也就在这。普通cuda函数需要自行分配显存,作为全局货局部变量。既然此函数分配了工作空间,且看如何调用这些显存吧。...

2019-11-15 10:45:24 396 0

原创 一文玩转pytorch转onnx-tensorRT ——(1)创建tensorRT层

基本说明 对c++,tensorRT提供了一个纯虚类的接口,通过实现类内的虚函数,就可以在tensorRT中运行自定义层。注意nvinfer1::IPluginV2和nvinfer1::IPluginCreator配合使用;nvinfer1::IPlugin和nvinfer1::IPlugi...

2019-11-15 10:28:32 803 0

原创 c++ 异步编程

背景 需要提高工程运行效率,将里面多个环节进行同步处理。但是在网上找了几个demo之后,发现调用复杂的库(future等)和模块用到的库可能存在潜在的冲突,结果future好像和tensorRT冲突,thread好像和openGL冲突。存在一些问题。试来试去,还是最简单的thread比较好使,o...

2019-10-10 13:23:17 861 0

原创 c++调用python numpy编程

背景 现在用c++重构了python工程,有一部分后处理不想再花时间重构了,所以直接拿过来调用。边搜资料边做的,做这个demo花了些时间,所以记下来以防忘记。 资料 找了很多的c++调用python的方法,首先可以肯定的有不止一种方式,直接使用python库、numpy arrayobjec...

2019-10-10 12:50:12 2598 0

原创 ubuntu跟目录满导致不能开机

进入特殊模式 recovery或者emgency mode可以输入命令。所以首先想办法进入这种模式。 切换模式的方法 查找大容量大目录 df -h 可能出现Read-only file system mount -o remount / 扩展跟目录 可以参考这个文章 我想还是先删除比较方便 使用l...

2019-08-09 12:06:38 898 0

原创 nividia retinanet使用笔记

deb & run conflicting 2.7. Handle Conflicting Installation Methods Unable to determine the device handle for GPU 0000:B3:00.0: https://b...

2019-08-07 15:01:53 527 0

原创 T4安装踩坑记录

T4不能被识别 目前还在进行中,有一些结论不太准确,我尽量把所有可能的猜测都列下;有些猜测不用完全去确认也可以进行下去 t4是计算卡,不能单独使用。猜测如下 它需要配合其他有视频输出口的显卡使用(非充分必要条件——和其他有视频输出口的显卡配合时,可以正常使用;反过来是否可以使用主...

2019-08-01 10:57:20 764 1

原创 iTerm2 配置

iTerm2下配置ssh自动登录和使用lrzsz上传下载 Mac OS 终端利器 iTerm2

2019-07-04 15:10:57 1179 1

原创 pytorch0.4添加自定义cuda层

1. cuda函数的基础类型c或者c++ pytorch扩展工具函数时,c或者c++是分开的。基本的命令和g++有很多相似之处。所以,打算使用不同的扩展方式时,需要相应的源码是c或者c++的。不然会出很多乱七八糟的问题。 另外,pytorch 的官方网站上能找到完全用c语言写forward和bac...

2019-05-14 19:00:40 575 0

原创 undefined reference to `nppiWarpAffine_8u_C1R'

npp:NVIDIA Performance Primitives 其官方网站里有很多介绍,NPP是重要的一环产品线 问题:undefined reference to `nppiWarpAffine_8u_C1R’ 诸如此类的问题,在题目中的链接里有一些介绍,上面有相应的库介绍。cuda编译的时...

2019-05-07 14:54:22 310 0

原创 ubuntu内核启动列表管理

目的 有时候想去更换ubuntu的内核,可以通过修改启动项来管理,操作比较简单。没有交互界面或者调整默认项的时候,可以修改配置文件 查看启动列表 启动项的列表可以通过查看/boot/grub/grub.cfg(不要编辑这个文件) 其中的menuentry和subentry可以比较清晰的表明他们的逻...

2019-04-28 11:31:16 569 0

原创 dldt安装的问题

1. 背景 openCV的dldt模块集成了一系列的神经网络的方法,可以直接部署到intel的硬件“神经棒”上去。 鉴于OpenCV一贯的小而精的模型,我们看中它的模型和模型参数,想看看是不是也可以部署到其他框架下。 2. dldt的模型 下载:opencv的神经网络的一系列的模型可...

2019-03-27 11:25:28 511 0

原创 冻结网络pytorch

冻结pytorch的网络有两种方式 1. 冻结方式一:lr=0 caffe反正是这么写的,具体方式如下 model_params = [{'params': base_params, 'lr': 0}, ...

2019-03-26 18:35:35 999 0

原创 pycharm过滤

排除对象后缀 .svn;.cvs;.idea;.DS_Store;.git;.hg;.hprof;.pyc;.so;.pyx;.c;.o;*.npz 位置 tools/Deployment/options/Exclude 作用 下载远程项目时可以排除部分对象

2019-03-26 07:34:56 233 0

原创 dldt安装的问题

1. 背景 openCV的dldt模块集成了一系列的神经网络的方法,可以直接部署到intel的硬件“神经棒”上去。 鉴于OpenCV一贯的小而精的模型,我们看中它的模型和模型参数,想看看是不是也可以部署到其他框架下。 2. dldt的模型 下载:opencv的神经网络的一系列的模型可以再gith...

2019-03-25 15:28:18 99 0

原创 时序异常检测

时序异常检测建模 这是我看到的比较完善且完整的时序的异常检测的简单分析文章

2019-03-18 19:48:08 2151 0

原创 人脸属性识别数据库和开源项目

数据库 可用于研究的数据集 关键点检测可用数据库:BioID(1000张 20个关键点),LFPW:(1132 张,29个关键点),AFLW(25993张,21个关键点),COFW:(1852张,每个人脸标定29个关键点),ICCV13/MVFW :(2500张,68个关键点),OCFW: (38...

2019-03-07 20:09:44 1895 0

原创 pytorch中的梯度更新

背景 使用pytorch时,有一个yolov3的bug,我认为涉及到学习率的调整。收集到tencent yolov3和mxnet开源的yolov3,两个优化器中的学习率设置不一样,而且使用GPU数目和batch的更新也不太一样。据此,我简单的了解了下pytorch的权重梯度的更新策略,看看能否一窥...

2019-02-28 17:53:48 2331 1

原创 物体检测碎片知识

物体检测碎片归一化系数faster rcnnR-FCN结构的发展two stage的头部结构 归一化系数 faster rcnn L({pi},{ti})=1Ncls(Lcls(pi,pi∗))+λ1Nreg(Lreg(ti,ti∗)) L(\{p_{i}\},\{t_{i}\}) = \frac...

2019-01-27 09:26:36 121 0

原创 神经网络调参数总结

收集的神经网络不收敛参考 参考这个外文链接 主要是一些参数的设置,如何去逐项检查以及如何检查,当然还有为什么要检查 包括:正则项、分析结果、预处理、数据归一化、网络内部错误变化 可视化是一个重要的方式可以帮你理解网络的特征走向,如tensorboard及变种mxboard之类的可以很好的...

2018-11-14 21:15:11 916 0

原创 软件收录

收录一些常用软件 1. 编辑软件 1)文本编辑 markdown:csdn、码云;Cmd Markdown.exe Latex:miktex + winEdit 2)程序编辑 pycharm:支持ssh matlab:GNU Octave 3)思维导图 xmind 8 2. 逻辑组织 ...

2018-11-08 10:54:08 197 0

原创 caffe中使用自定义python层

今天碰巧用到这个,遇到了一些问题,所以顺便记录下来。 直接使用train.sh中的方式,应该是行不通 比如如下的方式 #!/usr/bin/env sh set -e ./build/tools/caffe train --solver=/***/adam_solver.prototxt --gp...

2018-10-23 16:15:08 995 1

原创 物体检测 资料大搜集

物体检测基本知识科普: P-R curve & AP的解释: Object-Detection-Metrics mAP的产生和解释: What is Mean Average Precision? 物体检测的代码/开源项目集合 物体检测的主流框架 ---- 资料集合: h...

2018-09-21 16:46:05 216 0

原创 ubuntu配置出现的一堆问题求解

服务器一直有安装各种库,以及各种更新。隔了几个月再重新使用caffe的时候,出现了一堆错误,然后清理了一下无用软件sudo apt auto-remove,结果删去了很多有用的软件。几个依赖库不明就里的被删除了???!!!! 然后,一不做二不休的态度,干脆就想把cuda、nvidia驱动都给升级...

2018-09-19 20:10:41 405 0

原创 人脸关键点及检测 开源项目

人脸关键点网络 FAN:时间5s DAN:时间1.5s openpose face:效果差 3000FPS:只能看正脸,opencv或dlib中有集成,速度飞快,10ms+ VANface:https://github.com/lsy17096535/face-landmark 据称5m...

2018-09-17 20:42:40 4121 4

原创 模型压缩开源库整理

Tensorflow Lite: mxnet - TVM RPC对接移动设备的框架 EAIDK 搭载了 OPEN AI LAB 的核心 AI 开发平台 AID;和②的目标多少有些类似,将面向移动端的接口全部封装。类似于树莓派、arduino甚至安卓将硬件可编程话,一定程度上的封装后,AI方向的...

2018-09-17 19:06:34 1925 2

原创 dlib初识 c++代码

网站 http://dlib.net/ 这是一个提供机器学习的算法库,比如它提供的深度学习的算法包就特小,速度快。 神经网络: 这是我见过的比较简洁的网络模型写法、实现,所有的包编译完不到80M。用于人脸检测的模型参数一共十几kb。比如说人脸检测的模型是这么写的: template &am...

2018-08-20 17:36:54 2187 0

原创 关于python和环境变量PATH

最近遇到了python的安装问题,因为终端提示说其涉及到文件夹权限,pip指向了用户下的路径。我更想这些对多用户来讲的全局变量都放到/usr或者/etc这些文件夹下。 环境变量 之前遇到这个问题,都是用到了现查,现在搞清楚一下他们的关系。 对于可以设置全局变量的地方,一博客文章中有简单介绍。...

2018-07-18 10:10:54 3317 0

原创 face alignment network 相关开源代码

收集一些人脸对齐相关的开源代码,并做简单的比较 1. 基于MTCNN的方法 [code],是matlab实现的,在sphereface等里面用于数据预处理,速度快,论文时间为2016年 2. cmu的openpose: 相关的姿态pose、手势为2017年论文;人脸的检测是使用手势的同一套...

2018-07-17 17:49:19 645 0

原创 mxnet问题整理(二)

在mxnet中需要对conv进行修改,所以遇到了一些问题,选择难理解的问题记下来。1. 修改完conv层函数之后,出现输出结果是null的问题按照以下的方式来就好了class new_conv(nn.Conv2D): def __init__(self, channels, kernel_...

2018-07-03 11:13:03 482 1

原创 window10下安装caffe

一、预安装的文件:1. 破解版vs2015地址,下面地址包含有破解序列号https://www.cnblogs.com/bwlluck/p/5514424.htmlvs安装时,需要注意勾选一些SDK相关的选项:https://blog.csdn.net/u012348774/article/det...

2018-06-27 18:25:23 3362 0

原创 模型压缩之剪枝小综述

现在主流的稀疏化方法:1)      han song提出的方法,低于某一阈值的归零,但是这种非结构化的稀疏矩阵现有的库很难处理,需要专门设置。【S. Han, J. Pool, J. Tran, andW. Dally. Learning both weights andconnections ...

2018-06-20 18:47:30 2177 0

提示
确定要删除当前文章?
取消 删除