- 博客(24)
- 资源 (6)
- 收藏
- 关注
原创 mobilenet, shufflenet 系列随笔
mobilenNet系列出自Goole,shuffleNet系列出自Face++,这两个公司的文章都是值得反复去揣摩的,去思考这些网络背后设计的出发点和设计的原则,而不是单纯停留在仅仅读懂网络结构而已。当然本文均为笔者自身理解,读者觉得有不妥当的地方,欢迎讨论。为了方便,以下简记mobileNet为m,shuffleNet为s。MobileNetm v1是直筒状结构,xception使...
2018-08-03 20:23:56 1925 1
原创 VALSE2019小记
趁着有空去看了一波valse,和很多论文的作者当面讨论了一些问题,在此主要记录对一些paper的见解。1. FishNet: A Versatile Backbone for Image, Region, and Pixel Level Prediction根据欧阳万里老师介绍,这篇文章起初的motivation是希望将hourglass结构引入到分类网络中,看有没有效果,实验表明没...
2019-04-15 11:36:54 1575
原创 SSD代码解读(三)——MultiboxLoss
SSD系列代码解读:(一) Prior BoxSSD系列代码解读:(二) Data AugmentationSSD系列代码解读:(三)MultiboxLoss本部分代码仍然是基于pytorch版本的,非官方的caffe实现。个人认为本部分是SSD中最为难懂的一部分。在解释MultiboxLoss之前,必须要弄清楚SSD的检测head部分数据走向,也就是输出了什么。for (...
2019-03-21 20:31:16 4281
原创 SSD代码解读(二)——Data Augmentation
SSD系列代码解读:(一) Prior BoxSSD系列代码解读:(二) Data AugmentationSSD系列代码解读:(三)MultiboxLoss本部分代码是pytorch版本的,非官方的caffe实现,贴上代码解读的同时会与caffe实现进行比较。先贴代码import torchfrom torchvision import transformsimport ...
2019-03-08 17:30:03 3139 4
原创 极简论文笔记
Because of sometrivia, I have read veryfew papers in the past few months. In the next period of time, I will compensateit, and record my understandings of thepaper by English, meanwhilestrengthe...
2019-01-11 20:41:10 463
原创 BatchNorm 理解
BN可以说是NN发展中的一个里程碑式的结构了,不增加inference时间,调参变得简单,收敛更快效果更好。虽然提出的时间已经很久了,而且网上关于BN的解释一堆一堆的,但是博主觉得有不少解释是欠妥的,在此贴出博主贴出对caffe中BN源码的解释和自己对BN的理解,欢迎讨论。caffe中BN的实现比较反人类。BatchNorm层单纯实现标准化,再用一个scale层添加 参数,共同完成BN。...
2018-09-24 21:14:00 3800 9
原创 deeplab系列总结(deeplab v1& v2 & v3 & v3+)
最近花了几天时间把deeplab系列撸了一遍,直观感受是不如当初看RCNN系列来的激动啊......像RPN这种划时代的改变没有看到--直奔主题。Deeplab v1&v2paper:deeplab v1&& deeplab v2远古版本的deeplab系列,就像RCNN一样,其实了解了后面的v3和v3+就可以不太管这些了(个人拙见)。但是为了完整性和连贯性...
2018-07-21 21:34:15 61055 14
原创 dilation conv 和 deconv
最近工作要用到dilation conv,在此总结一下空洞卷积,并和deconv进行对比。dilation conv首先空洞卷积的目的是为了在扩大感受野的同时,不降低图片分辨率和不引入额外参数及计算量(一般在CNN中扩大感受野都需要使用s>1的conv或者pooling,导致分辨率降低,不利于segmentation。如果使用大卷积核,确实可以达到增大感受野,但是会引入额外的参数及计算量)。...
2018-07-02 11:23:25 8351 2
原创 随笔记(二)
2018.06.03 Python代码生成prototxt如下代码生成peleenet.prototxt。Python文件和deploy文件的github 链接. 求个小心心 --#coding: utf-8#by Chen yhtran_channel = 32 #growth_rateclass Genpelee(): def __init__(s...
2018-06-03 20:22:52 2656
原创 DUC/STDN的caffe源码实现
CVPR2018有一篇detection的文章STDN,我之前记录过此文的笔记,文章的上采样方法和DUC基本无异(-!!), 本人仍然坚守在caffe,目前要用到这个层,所以把这个层的代码实现一下。先不谈源码,等backward写完后在放到我的git上面。因为之前也没怎么写过layer,所以此处记录会犯错的地方。1. 有一些在setup,reshape,forward等都会用到的变量,要定...
2018-05-07 20:33:46 1219 2
原创 SSD代码解读(一)——Prior Box Layer
SSD系列代码解读:(一) Prior BoxSSD系列代码解读:(二) Data AugmentationSSD系列代码解读:(三)MultiboxLoss本部分代码是基于weiliu的ssd,先贴prior_box.hpp代码。#ifndef CAFFE_PRIORBOX_LAYER_HPP_#define CAFFE_PRIORBOX_LAYER_HPP_#incl...
2018-04-24 21:32:27 3975 1
原创 caffemodel的剪枝与压缩(二)
利用Network Slimmng对FSSD进行prune,在voc07上获得79.64的map,TITAN X上150FPS的效果,链接:https://github.com/dlyldxwl/fssd.pytorch 觉得都有用的看官朋友们,给个star随便写了点注释,代码贴上来了,写的比较粗糙,很容易看懂,无需多言.# coding:utf-8# by chen yh...
2018-03-09 21:27:47 6961 50
原创 STDN: Scale-Transferrable Object Detection 论文笔记
原文链接:Scale-Transferrable Object Detection(暂时只有网盘的 - -)这篇论文是上交的,收录于CVPR2018。直接看算法过程。Figure1 是几种常见的detect算法对比,(a)是最原始的用一层feature来predict;(b)是FPN,Top-down结构;(c)是SSD,多scale检测;(d)是STDN,也就是本文算法,大致可以看出是和SSD比...
2018-02-27 17:31:51 4887 6
原创 FSSD: Feature Fusion Single Shot Multibox Detector 论文笔记
论文:FSSD: Feature Fusion Single Shot Multibox Detector caffe实现:链接 该篇论文出自北航,看起来比较容易懂,因此笔记会写的简单一点。Introduction言归正传,本文是以SSD为基底进行“改造”的一篇文章。SSD是从网络的不同层中抽取不同scale的feature直接做predict,所以没有充分融合不同scale的feature。后
2018-02-14 12:07:18 11789 15
原创 caffemodel的剪枝与压缩(一)
利用Network Slimmng对FSSD进行prune,在voc07上获得79.64的map,TITAN X上150FPS的效果,链接:https://github.com/dlyldxwl/fssd.pytorch 觉得都有用的看官朋友们,给个starcaffemodel里每一层的卷积核维度为ouput-channel×input-channel×height×weight. 本...
2018-02-09 15:34:18 5745 3
原创 Mobilenet V2 论文笔记
先上链接 论文:Inverted Residuals and Linear Bottlenecks: Mobile Networks for Classification, Detection and Segmentation. 原文:链接 实现:caffe下的实现Introduction本文是谷歌公司的又一新作,目标主要是在提升现有算法的精度的同时也提升速度,以便加速深度网...
2018-01-18 21:59:01 11632 4
原创 Python 代码实现在线答题的自动搜索
这算是一个小插曲吧,即使mobilenet V2论文公布了,还是抵挡不了答题致富的幻想,,哈哈哈 。。 言归正传。因为一些答题外挂延迟太高,故自己操刀写了一个Python代码来实现自动搜索。算法的主要流程是:先对手机进行截屏,下载到电脑上;再对截屏进行裁剪,以获得题干部分的图片;接着OCR对题干图片进行字符识别并处理;最后获得url,使用baidu进行搜索。主要使用的工具有adb和tesserac
2018-01-18 10:34:26 19142 1
原创 two-stage算法一点思考
所有的two-stage detection 算法大致都由两部分组成:RPN生成proposal和对proposal的cls和reg。本科做毕设用了Faster RCNN,对此类算法稍稍有点了解,但是还是很多迷惑。最近本人认真研读了light head rcnn,对two stage算法进行了比较,也解答了之前的一些疑惑。一一列举: 1.RPN网络中anchor和proposal的关系。以fa...
2017-12-17 16:36:02 5071
原创 Light Head R-CNN论文笔记
先上链接: 论文:Light-Head R-CNN: In Defense of Two-Stage Object Detector 链接:https://arxiv.org/abs/1711.07264 代码: TF链接 introduction本篇文章介绍的算法是是旷视和清华大学在COCO 2017比赛拿到冠军的算法。目前常用的object detection框架有两种:一种...
2017-12-04 21:37:54 13301 11
原创 随笔记
置顶Detection 算法Faster rcnn:链接R-FCN:链接1;链接2Light Head R-CNN:链接SSD:链接FSSD :链接ION :链接HyperNet:链接Networkinception系列网络的总结:链接1;链接2 Shufflenet:链接Densenet:链接inception v3 netscope :链接;...
2017-12-04 10:02:49 1052 2
原创 复现数据集GT框matlab和Python代码
本人最近在捣鼓数据集,网上找的大多数数据集的标注都不是很精确,如果用这些数据集直接训练效果会不理想,但是全部重新标注工作量太大,所以博主写了一个程序可以直观看到数据集标注的GT,以确定需要重新打标注的图片。代码里面的txt是数据集的所有txt合到一起后的文本,如下图所示:把llabel文件夹下大量的txt文件合并为一个txt,可以用bash语句执行:cat ./labels/*
2017-10-08 11:47:34 1407
原创 部分目标检测网络+自己训练过程……
博主最近接手了一个SSD有关的检测项目,大四的时候接触了DL,这段时间在训练mobilenet-SSD的时候想自己也努力努力对这些大牛级模型进行一些小修小补吧。SSD网络前几层用的是VGG部分网络,想了一下,接触DL有4,5个月了,对这些基本的网络还没进行一个系统的总结过,于是乎花了一下午的时间看了一些经典网络结构,话不多说转入正题。LeNet这是入门级网络模型,没什么好说的,一个字:...
2017-09-11 11:44:28 8305 5
转载 数据集与标注等工具
~~因为不太会使用OpenCV、matlab工具,所以在找一些比较简单的工具。 . .一、NLP标注工具BRATBRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的标注结果能够把无结构化的原始文本结构化,供计算机处理。利用该工具可以方便的获得各项NLP任务需要的标注语料。以下是利用该工具进行命名实体识别任务的标注例子。 WeTest...
2017-07-28 17:41:44 24789 3
原创 华硕部分飞行堡垒系列安装ubuntu16.04(uefi+gpt+win10环境)
本人笔记本华硕zx53vw6700,磁盘格式GPT,启动方式为uefi。安装ubuntu花了很长时间,期间真的是很多次都很崩溃啊,网上搜了一堆资料,得出了一个结论:很多华硕笔记本安装ubuntu都是一个艰难的过程。。话不多说,分享一下自己安装成功的经历。准备工作 下载ubuntu16.04镜像,官方下载制作启动盘的软件Rufus,第二行不按照标准步骤,改为“用于uefi计算机的GPT分区方
2017-04-03 10:30:14 16858 14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人