Sundrops的专栏

deep learning

排序:
默认
按更新时间
按访问量

Deformable Convolutional Networks解读

这篇论文是daijifeng老师又一篇好文,一贯的好想法,而且实现的很漂亮。

2017-12-14 17:42:22

阅读数:1313

评论数:5

SSD: Single Shot MultiBox Detector解读

此SSD非彼SSD,不过都有一个特点快,我之前读过了这篇,这次算是重温,而且前面介绍了很多检测网络,尤其是FPN时更是对SSD有一个很根本的解读,所以这篇博客算是一个SSD精华介绍,哈哈。 贡献和特点 SSD最大的贡献,就是在多个feature map上进行预测,这点我在上一篇FPN也说...

2017-11-29 23:22:33

阅读数:602

评论数:0

mask rcnn解读

上一篇中介绍faster rcnn,这次mask 基本在上次的基础上加了点代码,参考和引用1. mask rcnn slides 2. kaiming he maskrcnn 3. Ardian Umam mask rcnn,欢迎fork简版mask rcnn。

2017-11-21 00:08:52

阅读数:3010

评论数:2

faster rcnn源码解析

之前一直是使用faster rcnn对其中的代码并不是很了解,这次刚好复现mask rcnn就仔细阅读了faster rcnn,主要参考代码是pytorch-faster-rcnn ,部分参考和借用了以下博客的图片 [1] CNN目标检测(一):Faster RCNN详解 姊...

2017-11-20 23:50:01

阅读数:5299

评论数:5

《故乡》

14年写的一首短诗,今天突然翻到了就改了改,留念一下。 《故乡》 五年前, 别故乡, 一番流浪, 归来时,想看她, 她不让。 只是听人说, 我最爱的油菜花没了, 黑黑的柏油路横亘其上。...

2018-05-21 23:47:01

阅读数:5

评论数:0

Generative Models(生成模型)简介

著名物理学家费曼说过: What I cannot create, I do not understand. 所以我们要真正做到了解图像影音等,就必须要能创造它们。 Pixel RNN 收集一大堆图片,然后利用这些图片开始训练这个图片生成模型,根据前面的像素预测接下来的像素,训练结...

2018-04-30 23:08:37

阅读数:36

评论数:0

Video Caption Tutorial

欢迎star fork: video-caption.pytorch或者video-caption.pytorch 任务介绍 和image caption一样,不过是将图片换成了一段视频,根据视频内容给出一句文字描述。可用于后续的视频检索或者摘要生成,帮助智能体或者有视觉障碍的人理...

2018-04-26 00:26:45

阅读数:114

评论数:0

光流在视频检测和分割的再应用

之前介绍了光流提升视频识别的速度和精度的文章,这次还是光流在视频检测和分割的应用,不过做的更完善了 Towards High Performance Video Object Detection 如图所示,较上一篇博客中的两篇文章主要有3个地方改进(详细请看该论文中的Ablatio...

2018-04-25 21:45:14

阅读数:176

评论数:0

利用光流提升视频识别的速度和精度

daijifeng老师的两篇文章,利用光流提升视频识别的速度Deep Feature Flow for Video Recognition,利用光流提高视频的精度Flow-Guided Feature Aggregation for Video Object Detection,关于光流可参...

2018-04-03 11:59:39

阅读数:264

评论数:0

TH库学习(二): THTensorApply宏观理解(简化)

特别说明,本文大多思路和解释都源于: [1] PyTorch源码浅析(一) [2] PyTorch源码浅析(二) [3] tiny_lib TensorApply系列的宏函数是TH实现各种张量元素操作最重要的操作,它们负责把一个针对某些标量的操作应用到多个张量元素上去。在GPU部分是相当于...

2018-03-23 17:42:35

阅读数:30

评论数:0

TH库学习(一): THTensor, THStorage, THAllocator介绍

pytorch中的底层很多代码都是来源于的torch的低层Tensor库 TH = TorcH THC = TorcH Cuda THCS = TorcH Cuda Sparse THCUNN = TorcH CUda Neural Network (see cunn...

2018-03-22 00:45:11

阅读数:84

评论数:0

TH库学习: C语言实现模板编程(预备知识)

提前声明下面的例子和部分代码来源于PyTorch源码浅析(一) 引子 假如我们要实现一个函数: 两个Vector的相加,我们需要考虑int、float、double这3种类型,在C++中我们可以利用模板轻松搞定 // C++模板类,轻松搞定 template<t...

2018-03-21 00:23:40

阅读数:43

评论数:0

TH库学习: strided indexing scheme(预备知识)

数组步长 首先介绍一下步长的概念即:相邻数组元素在内存中的开始地址的距离。数组步长如果等于数组元素的尺寸,则数组在内存中是连续的。比如int[10],如果它是连续的,则第0个元素和第1个元素在内存中开始地址的距离为sizeof(int),即刚好差一个元素的大小,如果不连续,则会大于一个元素的大小...

2018-03-19 22:24:55

阅读数:39

评论数:0

RNN, LSTM, GRU, SRU, Multi-Dimensional LSTM, Grid LSTM, Graph LSTM系列解读

RNN/Stacked RNN rnn一般根据输入和输出的数目分为5种 1. 一对一 最简单的rnn 2. 一对多 Image Captioning(image -> sequence of words) 3. 多对一 Sentiment Classificat...

2018-03-13 16:04:38

阅读数:229

评论数:2

Relation Networks for Object Detection解读

现在做detection的竞争相当激烈,能记住的就是ross kaiming团队和sunjian老师团队,还有今天的主角daijifeng老师团队了arxiv link Motivation 众所周知,如果能model出物体之间的关系,那么对物体识别是大有裨益的。可是在深度学习领域...

2018-03-09 15:06:38

阅读数:271

评论数:0

Path Aggregation Network for Instance Segmentation解读

本篇论文是COCO 2017 instance segmentation的冠军,读了这篇论文再加上之前读论文的体会,和朱神交流后得到一个感悟: 同样一个work的小改动,你不能挖的深或者看得很浅,那你就是trick,而别人就能给科研界带来启发,ResNet很简单,但是kaiming他们就能把...

2018-03-08 16:32:38

阅读数:1153

评论数:0

RoIAlign源码解析

RoIAlign源码及示意图 /* * 参数解释 * bottom_data 需要做RoIAlign的feature map * spatial_scale feature map放缩的尺寸 vgg是1/16 * channels height width feature map的通道高和宽...

2018-02-01 20:31:31

阅读数:530

评论数:0

CapsuleNet的一个小例子

引用YouTube上一个up主的视频,讲解一个capsulenet的一个小例子。

2018-01-01 21:41:08

阅读数:352

评论数:0

FSSD解读

本文是SSD的改进版,算是SSD+FPN思想的结合。

2017-12-28 21:54:02

阅读数:645

评论数:0

A star算法

A star算法介绍 我们在解空间搜索问题的可行解或者最优解时常用宽度优先搜索(BFS)或者深度优先搜索(DFS),但是有时候会扩展出很多无用节点,搜索时间较长,而A*算法则是选择当前估计成本最低的节点进行扩展,图示如下: g(n)为从起始节点到节点n的成本,h(n)为从节点n到目标点的估...

2017-12-22 19:58:35

阅读数:361

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭