Dlyldxwl-CSDN博客

原创 mobilenet, shufflenet 系列随笔

mobilenNet系列出自Goole，shuffleNet系列出自Face++，这两个公司的文章都是值得反复去揣摩的，去思考这些网络背后设计的出发点和设计的原则，而不是单纯停留在仅仅读懂网络结构而已。当然本文均为笔者自身理解，读者觉得有不妥当的地方，欢迎讨论。为了方便，以下简记mobileNet为m，shuffleNet为s。MobileNetm v1是直筒状结构，xception使...

2018-08-03 20:23:56 1925 1

原创 VALSE2019小记

趁着有空去看了一波valse，和很多论文的作者当面讨论了一些问题，在此主要记录对一些paper的见解。1. FishNet: A Versatile Backbone for Image, Region, and Pixel Level Prediction根据欧阳万里老师介绍，这篇文章起初的motivation是希望将hourglass结构引入到分类网络中，看有没有效果，实验表明没...

2019-04-15 11:36:54 1575

原创 SSD代码解读（三）——MultiboxLoss

SSD系列代码解读：（一） Prior BoxSSD系列代码解读：（二） Data AugmentationSSD系列代码解读：（三）MultiboxLoss本部分代码仍然是基于pytorch版本的，非官方的caffe实现。个人认为本部分是SSD中最为难懂的一部分。在解释MultiboxLoss之前，必须要弄清楚SSD的检测head部分数据走向，也就是输出了什么。for (...

2019-03-21 20:31:16 4281

原创 SSD代码解读（二）——Data Augmentation

SSD系列代码解读：（一） Prior BoxSSD系列代码解读：（二） Data AugmentationSSD系列代码解读：（三）MultiboxLoss本部分代码是pytorch版本的，非官方的caffe实现，贴上代码解读的同时会与caffe实现进行比较。先贴代码import torchfrom torchvision import transformsimport ...

2019-03-08 17:30:03 3139 4

原创极简论文笔记

Because of sometrivia, I have read veryfew papers in the past few months. In the next period of time, I will compensateit, and record my understandings of thepaper by English, meanwhilestrengthe...

2019-01-11 20:41:10 463

原创 BatchNorm 理解

BN可以说是NN发展中的一个里程碑式的结构了，不增加inference时间，调参变得简单，收敛更快效果更好。虽然提出的时间已经很久了，而且网上关于BN的解释一堆一堆的，但是博主觉得有不少解释是欠妥的，在此贴出博主贴出对caffe中BN源码的解释和自己对BN的理解，欢迎讨论。caffe中BN的实现比较反人类。BatchNorm层单纯实现标准化，再用一个scale层添加参数，共同完成BN。...

2018-09-24 21:14:00 3800 9

原创 deeplab系列总结（deeplab v1& v2 & v3 & v3+）

最近花了几天时间把deeplab系列撸了一遍，直观感受是不如当初看RCNN系列来的激动啊......像RPN这种划时代的改变没有看到--直奔主题。Deeplab v1&v2paper：deeplab v1&& deeplab v2远古版本的deeplab系列，就像RCNN一样，其实了解了后面的v3和v3+就可以不太管这些了（个人拙见）。但是为了完整性和连贯性...

2018-07-21 21:34:15 61055 14

最近工作要用到dilation conv，在此总结一下空洞卷积，并和deconv进行对比。dilation conv首先空洞卷积的目的是为了在扩大感受野的同时，不降低图片分辨率和不引入额外参数及计算量（一般在CNN中扩大感受野都需要使用s>1的conv或者pooling，导致分辨率降低，不利于segmentation。如果使用大卷积核，确实可以达到增大感受野，但是会引入额外的参数及计算量）。...

2018-07-02 11:23:25 8351 2

原创随笔记（二）

2018.06.03 Python代码生成prototxt如下代码生成peleenet.prototxt。Python文件和deploy文件的github 链接. 求个小心心 --#coding: utf-8#by Chen yhtran_channel = 32 #growth_rateclass Genpelee(): def __init__(s...

2018-06-03 20:22:52 2656

原创 DUC/STDN的caffe源码实现

CVPR2018有一篇detection的文章STDN，我之前记录过此文的笔记，文章的上采样方法和DUC基本无异(-!!), 本人仍然坚守在caffe,目前要用到这个层，所以把这个层的代码实现一下。先不谈源码，等backward写完后在放到我的git上面。因为之前也没怎么写过layer，所以此处记录会犯错的地方。1. 有一些在setup,reshape，forward等都会用到的变量，要定...

2018-05-07 20:33:46 1219 2

原创 SSD代码解读（一）——Prior Box Layer

SSD系列代码解读：（一） Prior BoxSSD系列代码解读：（二） Data AugmentationSSD系列代码解读：（三）MultiboxLoss本部分代码是基于weiliu的ssd，先贴prior_box.hpp代码。#ifndef CAFFE_PRIORBOX_LAYER_HPP_#define CAFFE_PRIORBOX_LAYER_HPP_#incl...

2018-04-24 21:32:27 3975 1

原创 caffemodel的剪枝与压缩(二)

利用Network Slimmng对FSSD进行prune,在voc07上获得79.64的map,TITAN X上150FPS的效果，链接：https://github.com/dlyldxwl/fssd.pytorch 觉得都有用的看官朋友们，给个star随便写了点注释,代码贴上来了,写的比较粗糙,很容易看懂,无需多言.# coding:utf-8# by chen yh...

2018-03-09 21:27:47 6961 50

原创 STDN: Scale-Transferrable Object Detection 论文笔记

原文链接：Scale-Transferrable Object Detection（暂时只有网盘的 - -）这篇论文是上交的，收录于CVPR2018。直接看算法过程。Figure1 是几种常见的detect算法对比，(a)是最原始的用一层feature来predict；(b)是FPN，Top-down结构；(c)是SSD，多scale检测；(d)是STDN，也就是本文算法，大致可以看出是和SSD比...

2018-02-27 17:31:51 4887 6

原创 FSSD: Feature Fusion Single Shot Multibox Detector 论文笔记

论文：FSSD: Feature Fusion Single Shot Multibox Detector caffe实现：链接该篇论文出自北航，看起来比较容易懂，因此笔记会写的简单一点。Introduction言归正传，本文是以SSD为基底进行“改造”的一篇文章。SSD是从网络的不同层中抽取不同scale的feature直接做predict，所以没有充分融合不同scale的feature。后

2018-02-14 12:07:18 11789 15

原创 caffemodel的剪枝与压缩(一)

利用Network Slimmng对FSSD进行prune,在voc07上获得79.64的map,TITAN X上150FPS的效果，链接：https://github.com/dlyldxwl/fssd.pytorch 觉得都有用的看官朋友们，给个starcaffemodel里每一层的卷积核维度为ouput-channel×input-channel×height×weight. 本...

2018-02-09 15:34:18 5745 3

原创 Mobilenet V2 论文笔记

先上链接论文：Inverted Residuals and Linear Bottlenecks: Mobile Networks for Classification, Detection and Segmentation. 原文：链接实现：caffe下的实现Introduction本文是谷歌公司的又一新作，目标主要是在提升现有算法的精度的同时也提升速度，以便加速深度网...

2018-01-18 21:59:01 11632 4

原创 Python 代码实现在线答题的自动搜索

这算是一个小插曲吧，即使mobilenet V2论文公布了，还是抵挡不了答题致富的幻想，，哈哈哈。。言归正传。因为一些答题外挂延迟太高，故自己操刀写了一个Python代码来实现自动搜索。算法的主要流程是：先对手机进行截屏，下载到电脑上；再对截屏进行裁剪，以获得题干部分的图片；接着OCR对题干图片进行字符识别并处理；最后获得url，使用baidu进行搜索。主要使用的工具有adb和tesserac

2018-01-18 10:34:26 19142 1

原创 two-stage算法一点思考

所有的two-stage detection 算法大致都由两部分组成：RPN生成proposal和对proposal的cls和reg。本科做毕设用了Faster RCNN，对此类算法稍稍有点了解，但是还是很多迷惑。最近本人认真研读了light head rcnn，对two stage算法进行了比较，也解答了之前的一些疑惑。一一列举： 1.RPN网络中anchor和proposal的关系。以fa...

2017-12-17 16:36:02 5071

原创 Light Head R-CNN论文笔记

先上链接：论文：Light-Head R-CNN: In Defense of Two-Stage Object Detector 链接：https://arxiv.org/abs/1711.07264 代码： TF链接 introduction本篇文章介绍的算法是是旷视和清华大学在COCO 2017比赛拿到冠军的算法。目前常用的object detection框架有两种：一种...

2017-12-04 21:37:54 13301 11

原创随笔记

置顶Detection 算法Faster rcnn：链接R-FCN：链接1；链接2Light Head R-CNN：链接SSD：链接FSSD ：链接ION ：链接HyperNet：链接Networkinception系列网络的总结：链接1；链接2 Shufflenet：链接Densenet：链接inception v3 netscope ：链接；...

2017-12-04 10:02:49 1052 2

原创复现数据集GT框matlab和Python代码

本人最近在捣鼓数据集，网上找的大多数数据集的标注都不是很精确，如果用这些数据集直接训练效果会不理想，但是全部重新标注工作量太大，所以博主写了一个程序可以直观看到数据集标注的GT，以确定需要重新打标注的图片。代码里面的txt是数据集的所有txt合到一起后的文本，如下图所示：把llabel文件夹下大量的txt文件合并为一个txt，可以用bash语句执行：cat ./labels/*

2017-10-08 11:47:34 1407

原创部分目标检测网络+自己训练过程……

博主最近接手了一个SSD有关的检测项目，大四的时候接触了DL，这段时间在训练mobilenet-SSD的时候想自己也努力努力对这些大牛级模型进行一些小修小补吧。SSD网络前几层用的是VGG部分网络，想了一下，接触DL有4,5个月了，对这些基本的网络还没进行一个系统的总结过，于是乎花了一下午的时间看了一些经典网络结构，话不多说转入正题。LeNet这是入门级网络模型，没什么好说的，一个字：...

2017-09-11 11:44:28 8305 5

转载数据集与标注等工具

~~因为不太会使用OpenCV、matlab工具，所以在找一些比较简单的工具。 . .一、NLP标注工具BRATBRAT是一个基于web的文本标注工具，主要用于对文本的结构化标注，用BRAT生成的标注结果能够把无结构化的原始文本结构化，供计算机处理。利用该工具可以方便的获得各项NLP任务需要的标注语料。以下是利用该工具进行命名实体识别任务的标注例子。 WeTest...

2017-07-28 17:41:44 24789 3

原创华硕部分飞行堡垒系列安装ubuntu16.04（uefi+gpt+win10环境）

本人笔记本华硕zx53vw6700，磁盘格式GPT，启动方式为uefi。安装ubuntu花了很长时间，期间真的是很多次都很崩溃啊，网上搜了一堆资料，得出了一个结论：很多华硕笔记本安装ubuntu都是一个艰难的过程。。话不多说，分享一下自己安装成功的经历。准备工作下载ubuntu16.04镜像，官方下载制作启动盘的软件Rufus，第二行不按照标准步骤，改为“用于uefi计算机的GPT分区方

2017-04-03 10:30:14 16858 14

deeplab 官方PPT

2018-07-22

L1范数剪枝

剪枝压缩剪枝压缩剪枝压缩剪枝压缩剪枝压缩剪枝压缩剪枝压缩剪枝压缩剪枝压缩

2018-03-23

caffemodel的剪枝压缩(部分权重置0)

将caffemodel中小于给定阈值的连接全部置0,如果用CSC等格式存储,会降低存储空间

2018-02-09

ｐｙｔｈｏｎ　实现ＧＴ框的标注并以合适的形式显示

ｐｙｔｈｏｎ　实现ＧＴ框的标注并以合适的形式显示，ｐｙｔｈｏｎ　实现ＧＴ框的标注并以合适的形式显示

2018-02-02

Python实现答题的自动搜索

Python实现答题的自动搜索Python实现答题的自动搜索Python实现答题的自动搜索Python实现答题的自动搜索

2018-01-18

通过label文件夹的txt文件展示数据集GT

通过数据集label文件夹的txt文件一次性或者依次展示数据集标注的GT

2017-10-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Dlyldxwl的博客

原创 mobilenet, shufflenet 系列随笔

原创 VALSE2019小记

原创 SSD代码解读（三）——MultiboxLoss

原创 SSD代码解读（二）——Data Augmentation

原创极简论文笔记

原创 BatchNorm 理解

原创 deeplab系列总结（deeplab v1& v2 & v3 & v3+）

原创 dilation conv 和 deconv

原创随笔记（二）

原创 DUC/STDN的caffe源码实现

原创 SSD代码解读（一）——Prior Box Layer

原创 caffemodel的剪枝与压缩(二)

原创 STDN: Scale-Transferrable Object Detection 论文笔记

原创 FSSD: Feature Fusion Single Shot Multibox Detector 论文笔记

原创 caffemodel的剪枝与压缩(一)

原创 Mobilenet V2 论文笔记

原创 Python 代码实现在线答题的自动搜索

原创 two-stage算法一点思考

原创 Light Head R-CNN论文笔记

原创随笔记

原创复现数据集GT框matlab和Python代码

原创部分目标检测网络+自己训练过程……

转载数据集与标注等工具

原创华硕部分飞行堡垒系列安装ubuntu16.04（uefi+gpt+win10环境）

deeplab 官方PPT

L1范数剪枝

caffemodel的剪枝压缩(部分权重置0)

ｐｙｔｈｏｎ　实现ＧＴ框的标注并以合适的形式显示

Python实现答题的自动搜索

通过label文件夹的txt文件展示数据集GT

空空如也

deeplab 官方PPT

L1范数剪枝

caffemodel的剪枝压缩(部分权重置0)

ｐｙｔｈｏｎ 实现ＧＴ框的标注并以合适的形式显示

Python实现答题的自动搜索

通过label文件夹的txt文件展示数据集GT

空空如也

ｐｙｔｈｏｎ　实现ＧＴ框的标注并以合适的形式显示