论文总结
文章平均质量分 94
南有乔木NTU
精诚所至,金石为开!
展开
-
SSD: Single Shot MultiBox Detector
SSD: Single Shot MultiBox Detector论文解读论文下载地址 github源码地址背景CVPR2016,在目标检测的领域上,RGB大神又参与了YOLO的工作,提出了一种新的目标检测的思路。YOLO的方法有了一个明显的优点就是速度很快,能达到45FPS,并且保持mAP63.4的精度。这种方法的提出,为实时性目标检测提供了可能,但是缺点也很明显,就是精度比较低,之前的方法F原创 2016-11-22 21:06:47 · 5637 阅读 · 7 评论 -
基于深度学习的目标检测研究进展
之前在深度学习大讲堂上看到了一篇师兄写的文章,膜拜师兄的同时转载一下。前言开始本文内容之前,我们先来看一下上边左侧的这张图,从图中你看到了什么物体?他们在什么位置?这还不简单,图中有一个猫和一个人,具体的位置就是上图右侧图像两个边框(bounding-box)所在的位置。其实刚刚的这个过程就是目标检测,目标检测就是“给定一张图像或者视频帧,找出其中所有目标的位置,并给出每个转载 2016-11-13 20:09:34 · 2254 阅读 · 1 评论 -
Fast-RCNN
Fast-RCNN论文下载地址 github网址简介首先膜拜一下RBG大神,RBG大神不仅是学术的大牛,工程也是大牛,代码写的很漂亮。这篇论文主要参考的是RCNN和SPPNet。需要按照这个顺序进行看paper,RCNN -> SPPNET -> Fast-RCNN -> Faster-RCNN。CNN在分类上效果很好。RNN就解决了为什么不把目标检测的问题转化到分类的问题上呢?Fast-RC原创 2016-11-06 16:32:03 · 3637 阅读 · 1 评论 -
Deep Learning of Binary Hash Codes for Fast Image Retrieval
Deep Learning of Binary Hash Codes for Fast Image Retrieval论文下载地址 这是一篇台湾中研院发表在CVPR2015年的文章。 之前deep hash,一般来说,网络根据图像的label,输入一个二元组或者三元组,利用CNN网络提取出图像的特征,根据相同的label应该具备比较接近的海明距离作为网络的优化目标,然后提出一种新的目标函数,采用原创 2016-11-02 20:18:09 · 1802 阅读 · 2 评论 -
Simultaneous Feature Learning and Hash Coding with Deep Neural Networks
Simultaneous Feature Learning and Hash Coding with Deep Neural Networks论文下载地址 自从2014年中山大学潘炎老师讲deep hash搬上舞台以来,关于deep hash的paper如雨后春笋般喷薄而出。本文也是潘炎老师15年参与发表的一篇paper,和之前的deep hash方法相比,本篇论文还是和先前的论文有着明显的改进。原创 2016-10-23 22:15:57 · 3200 阅读 · 1 评论 -
Deep Hashing Network for Efficient Similarity Retrieval
Deep Hashing Network for Efficient Similarity RetrievalIntroduce这是发表在AAAI-2016的一篇paper,下载地址 在本篇论文之前的监督Hash方法,第一步通过手动学习或者机器学习得到特征向量,第二步学习二进制的Hash Code。然而,这种方法存在明显的缺点,首先提取的特征并不一定完善,并且学习的二进制的Hash Code也有量原创 2016-10-11 20:26:22 · 4505 阅读 · 1 评论 -
Supervised Hashing for Image Retrieval via Image Representation Learning
Supervised Hashing for Image Retrieval via Image Representation Learning背景最邻近搜索,是给定一个query,返回空间中距离query最近的点。最直接暴力的方法就是计算查询与特征空间的距离,并按照从小到大的顺序进行排序,返回结果。但是采取这种方法,存储的空间消耗比较大,并且查询时间慢。拿互联网的图片为例,数据规模基本都是上亿级别原创 2016-09-26 21:41:04 · 3634 阅读 · 5 评论 -
Improved Techniques for Training GANs
Improved Techniques for Training GANspaper codeIntroduce对抗网络主要有两个应用:半监督学习和生成视觉相似图片。对抗网络的目的要训练生成网络G(z;θG)G(z;\theta^{G}),输入噪声zz生成x=G(z;θG)x=G(z;\theta^{G}),x为一幅图片,并且x满足真实的数据分布pdata(x)p_{data}(x)。判别网络D(原创 2017-03-02 20:14:32 · 11544 阅读 · 8 评论 -
R-FCN: Object Detection via Region-based Fully Convolutional Networks
R-FCN: Object Detection via Region-based Fully Convolutional Networks论文下载地址 源码地址 本篇论文是微软亚研何凯明代季峰的团队做的工作,虽然何凯明16年去了facebook,但是相关工作还在进行,代码还是公布在github上。感兴趣的可以从链接下载源码进行分析测试。Introduce论文主要提出了一种利用全卷积网络进行目标检原创 2016-11-30 20:15:37 · 5655 阅读 · 3 评论 -
G-CNN: an Iterative Grid Based Object Detector
G-CNN: an Iterative Grid Based Object DetectorIntroduce论文下载地址 G-CNN是CVPR16一篇关于目标检测的文章。从2016CVPR的文章可以看出目标检测的新的方法,去除Region Proposals。之前CNN做目标检测的方法,主要是RCNN,SPPNet,Fast-RCNN,Faster-RCNN等,这些方法基本都沿袭下面的思路:Cr原创 2016-12-09 11:23:08 · 2155 阅读 · 0 评论 -
Instance-Aware Hashing for Multi-Label Image Retrieval
Instance-Aware Hashing for Multi-Label Image Retrieval出版源:《IEEE Transactions on Image Processing》, 2016, 25(6):1-1 论文下载地址Introduce本篇论文是发表在TIP的工作,主要讲述了深度学习在多目标数据集上生成hash code上的应用。深度学习用到的监督信息主要来源于人工标注,但原创 2016-12-28 22:17:09 · 1358 阅读 · 0 评论 -
Inverted Multi-Index
Inverted Multi-Index简介Inverted Multi-index是Artem Babenko 和 Victor Lempitsky发表的一篇论文,论文起初发表在CVPR2012上,后来又增加了内容,又发表在2014的PAMI上,被引用的次数很高。 论文地址如下所示: CVPR2012 PAMI 2014引言分析整篇文章,总结下来想法还是很直观。首先分析传统的倒排索引,在传统原创 2016-09-14 23:13:17 · 3665 阅读 · 1 评论 -
Shortlist Selection with Residual-Aware Distance Estimator for K-Nearest Neighbor Search
Shortlist Selection with Residual-Aware Distance Estimator for K-Nearest Neighbor Search论文地址简介CVPR2016的一篇关于KNN搜索的paper。论文的主要贡献就是提出了关于shortlist计算的算法。在倒排索引的检索过程中,我们主要经过两步。第一:返回候选集。第二,采用更精确的距离度量风方式进行Reran原创 2016-09-19 23:07:46 · 708 阅读 · 0 评论 -
Feature Learning Based Deep Supervised Hashing with Pairwise Labels
Feature Learning Based Deep Supervised Hashing with Pairwise Labels现在实验室要求每周阅读一篇paper然后写成总结,作为一个博客的受益者,我也想写成博客的形式,将收获不局限于分享在小组内。但是,作为一个知识的传播者,如果传播错误的知识误导别人还不如不做。所以写每一篇博客都是忐忑不安,特别是国内一些厉害课题组的发表的paper,生怕误原创 2016-10-17 16:36:11 · 4667 阅读 · 2 评论 -
Factors in Finetuning Deep Model for Object Detection with Long-tail
Factors in Finetuning Deep Model for Object Detection with Long-tail论文下载地址 第一次看到Long-tail这个字眼是在一本经济学的书本上,由美国经济学家克里斯·安德森提出。最近看CVPR16看到一篇关于Long-tail的文章,看到名字就被吸引了(论文起一个好名字很重要),很想知道长尾理论在深度学习的finetunning中有原创 2016-12-06 17:23:01 · 1933 阅读 · 0 评论 -
DEEP COMPRESSION(深度学习网络参数压缩)
DEEP COMPRESSION: DEEP COMPRESSION: COMPRESSING DEEP NEURAL NETWORKS WITH PRUNING, TRAINED QUANTIZATION AND HUFFMAN CODING github 源码地址Introduce本篇论文是ICLR2016年的best paper,主要讲述关于深度学习网络参数的压缩工作。论文主要从下三点出发:原创 2017-01-02 23:01:32 · 15940 阅读 · 11 评论 -
LAPGAN
Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networkspaper codeIntroduce最近几年,对抗生成网络(GAN)在深度学习方面掀起了一股热潮,学术期刊会议上,关于对抗网络的文章层出不穷。从最开始goodfellow的gan,到 LapGan, Adversarial Autoencod原创 2017-02-22 09:45:13 · 3244 阅读 · 0 评论 -
PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection
PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection论文地址 github源码Introduction这篇论文是发表在2016nips上的一篇关于目标检测的论文,在这个论文之前,目标检测我个人看到效果最好的是Faster R-CNN+++(R-FCN的对比试验,+++代表添加了迭代边框回归,上下文信息原创 2016-12-18 11:07:20 · 2928 阅读 · 1 评论 -
A MultiPath Network for Object Detection
A MultiPath Network for Object Detection论文地址Introduce本篇论文是Facebook AI的工作,作者改进了目标检测的方法,在COCO数据集上进行实验,相比Seletive Search方法的fast R-CNN,将实验效果进一步提升了66%,在小物体上提高了4倍。作者的改进主要在以下三点:使用skip connections 融合多层的信息。使用原创 2017-01-14 15:50:54 · 2312 阅读 · 0 评论 -
YOLO 论文解读
You Only Look Once:Unified, Real-Time Object Detection论文下载地址 github源码地址简介YOLO是2016年CVPR的paper,这是RGB继RCNN,fast-RCNN,faster-RCNN以后,又一力作。针对目标检测中,无法实现实时性检测的问题,独辟蹊径,开创了目标检测的新思路。在RCNN中,作者将目标检测的问题转化到分类上来,提出了原创 2016-11-16 09:29:20 · 16125 阅读 · 4 评论