Sundrops的专栏

deep learning

mask rcnn解读

上一篇中介绍faster rcnn,这次mask 基本在上次的基础上加了点代码,参考和引用1. mask rcnn slides 2. kaiming he maskrcnn 3. Ardian Umam mask rcnn,欢迎fork简版mask rcnn。

2017-11-21 00:08:52

阅读数:8359

评论数:2

faster rcnn源码解析

之前一直是使用faster rcnn对其中的代码并不是很了解,这次刚好复现mask rcnn就仔细阅读了faster rcnn,主要参考代码是pytorch-faster-rcnn ,部分参考和借用了以下博客的图片 [1] CNN目标检测(一):Faster RCNN详解 姊...

2017-11-20 23:50:01

阅读数:20640

评论数:9

卷积神经网络结构简述(二)Inception系列网络

Inception是电影《盗梦空间》的外文原名,寓意是起点/开端,里面有一句经典的台词是: “we need to go deeper”,Inception Network取名于此 卷积神经网络结构简述(二)Inception系列网络WILL深度学习搬砖者​关注他50 人赞了该文章作为一...

2019-01-13 15:52:39

阅读数:30

评论数:0

Maxout netword and and NIN(Network in Network)

转载自论文笔记 《Maxout Networks》 && 《Network In Network》,有少量补充 各用一句话概括 常规卷积层: conv→relu maxout: several conv(full)→max NIN: server...

2019-01-13 15:25:46

阅读数:47

评论数:0

strided convolution vs pooling

strided convolution vs pooling

2019-01-04 11:28:49

阅读数:33

评论数:0

DenseNet记录

Motivation Resnet的特征有重复,测试时随机去掉一些residual block,对精度的影响很小 Resnet的变种InceptionNet、ResNext等是扩宽网络的width来提升性能 基于上,densenet利用feature reuse的思想来提升网络性能,...

2019-01-01 20:10:55

阅读数:58

评论数:0

Mask RCNN细节记录

精度问题 在FPN论文中有个表格显示 C5+2fc要比C4+C5差很多,这里的原因一是C5+2fc的stride为32,feature map太小了,anchor数量也少,RPN的召回率太低了,第二个原因应该是RoIPooling造成的偏差影响更大了,因为stride太大了(这个原因待定,不知道对...

2018-12-20 16:40:54

阅读数:41

评论数:0

Deformable ConvNets v2: More Deformable, Better Results

之前介绍过dai老师的DCN v1Deformable Convolutional Networks解读,现在出了V2效果更赞,实验分析也很充分。 分析DCN Effective receptive fields 视野域中每个点对响应的不同,有效视野域即为输入扰动后对输出的影响程度。比如求...

2018-12-11 13:56:32

阅读数:118

评论数:0

Resnet实现细节记录

Resnet # 注意BasicBlock和Bottleneck def resnet18(pretrained=False, **kwargs): model = ResNet(BasicBlock, [2, 2, 2, 2], **kwargs) return model de...

2018-12-10 16:25:43

阅读数:52

评论数:0

Revisiting RCNN: On Awakening the Classification Power of Faster RCNN

之前听过该文作者Yunchao Wei给的一个talk,当时仔细思考这篇论文,只是感觉加了参数肯定会变好呀,但是实际上该文在探索检测任务中分类和定位的关系。实际上,检测任务中有很多值得探讨的东西,比如之前博客讲过的一篇论文在探究训练和测试尺寸一致的问题,这些点看似都很小,但是我之前一直都是猜测...

2018-12-06 11:52:35

阅读数:98

评论数:0

End-to-End Learning of Motion Representation for Video Understanding

本文TVNet(Total Variable)是在TV-L1的基础上,改变一些操作变成可以训练且速度提高。

2018-11-25 14:33:19

阅读数:53

评论数:0

Graph RCNN解读

这个十月一堆事,心情也比较烦闷,就一直没有动笔写blog,之前一直在做scene graph的生成,然后最近恰好看到graph-rcnn这篇很不错的文章,就解读做个记录 Framework 以往做scene graph generation,基本都是在faster rcnn基础上检测出图片的物...

2018-10-24 16:29:57

阅读数:193

评论数:0

Scene Graph Generation by Iterative Message Passing解读

lifeifei老师团队在发布了Visual Genome数据集后,又在Scene Graph Generation做的新的创新 关于Scene Graph Generation就不再赘述,在上一篇neural motif介绍过,neural motif比这篇晚一些,效果也好一些 Im...

2018-07-09 20:57:47

阅读数:1955

评论数:0

Neural Motifs: Scene Graph Parsing with Global Contex解读

计算机视觉一步步发展,从最初的分类、检测、分割来到了更深层的理解: Scene Graph Generation(场景图生成),即开始预测场景中物体之间的关系 Scene Graph简介 原有的检测box或者实例分割的mask不能充分地表达出图片的语义,因为两个相同的box...

2018-07-05 22:37:18

阅读数:1918

评论数:10

SNIPER: Efficient Multi-Scale Training解读

它算是An Analysis of Scale Invariance in Object Detection-SNIP的增强版,依然在思考怎么能更好的解决检测中的多尺度问题 Introduction RCNN本身具有很好的尺度不变形,因为它先从图片中提取proposal,然后都re...

2018-07-04 00:10:29

阅读数:3806

评论数:0

An Analysis of Scale Invariance in Object Detection – SNIP解读

今天无意中看到这篇好文,在网上搜索时发现Naiyan Wang也在知乎上推荐了,还中了CVPR2018的oral,佩服! Introduction 这篇文章首先想探讨一个问题:scale变化对识别和检测的影响,然后就是upsample对于小物体的检测有用嘛?根据这两个问题的分析,本文提...

2018-07-03 17:27:03

阅读数:2301

评论数:0

Focal Loss for Dense Object Detection解读

还是Tsung-Yi Lin Piotr Dollar kaiming ross他们在Detection领域做的贡献Focal Loss for Dense Object Detection Motivation single stage的检测方法如YOLO、SSD等简单高效,但是精度...

2018-06-24 17:29:54

阅读数:1625

评论数:0

Learning to Segment Every Thing解读

kaiming ross他们一块的又一篇文章,基于mask rcnn的做的一个扩展,他们真是一直在推进着Detection Segmentation领域的发展 Introduction 目前做instance segmentation的方法都需要像素级标注,这样的话就很难有一个类别数目...

2018-06-21 19:14:53

阅读数:1666

评论数:0

光流在视频检测和分割的再应用

之前介绍了光流提升视频识别的速度和精度的文章,这次还是光流在视频检测和分割的应用,不过做的更完善了 Towards High Performance Video Object Detection 如图所示,较上一篇博客中的两篇文章主要有3个地方改进(详细请看该论文中的Ablatio...

2018-04-25 21:45:14

阅读数:2720

评论数:0

利用光流提升视频识别的速度和精度

daijifeng老师的两篇文章,利用光流提升视频识别的速度Deep Feature Flow for Video Recognition,利用光流提高视频的精度Flow-Guided Feature Aggregation for Video Object Detection,关于光流可参...

2018-04-03 11:59:39

阅读数:3681

评论数:1

提示
确定要删除当前文章?
取消 删除
关闭
关闭