论文总结_南有乔木NTU的博客-CSDN博客

论文总结

关注

文章平均质量分 94

关注数：文章数：20 文章阅读量：96860 文章收藏量：203

作者: 南有乔木NTU

精诚所至，金石为开！

展开

SSD: Single Shot MultiBox Detector

SSD: Single Shot MultiBox Detector论文解读论文下载地址 github源码地址背景CVPR2016，在目标检测的领域上，RGB大神又参与了YOLO的工作，提出了一种新的目标检测的思路。YOLO的方法有了一个明显的优点就是速度很快，能达到45FPS，并且保持mAP63.4的精度。这种方法的提出，为实时性目标检测提供了可能，但是缺点也很明显，就是精度比较低，之前的方法F

原创 2016-11-22 21:06:47 · 5635 阅读 · 7 评论
基于深度学习的目标检测研究进展

之前在深度学习大讲堂上看到了一篇师兄写的文章，膜拜师兄的同时转载一下。前言开始本文内容之前，我们先来看一下上边左侧的这张图，从图中你看到了什么物体？他们在什么位置？这还不简单，图中有一个猫和一个人，具体的位置就是上图右侧图像两个边框(bounding-box)所在的位置。其实刚刚的这个过程就是目标检测，目标检测就是“给定一张图像或者视频帧，找出其中所有目标的位置，并给出每个

转载 2016-11-13 20:09:34 · 2254 阅读 · 1 评论
Fast-RCNN

Fast-RCNN论文下载地址 github网址简介首先膜拜一下RBG大神，RBG大神不仅是学术的大牛，工程也是大牛，代码写的很漂亮。这篇论文主要参考的是RCNN和SPPNet。需要按照这个顺序进行看paper，RCNN -> SPPNET -> Fast-RCNN -> Faster-RCNN。CNN在分类上效果很好。RNN就解决了为什么不把目标检测的问题转化到分类的问题上呢？Fast-RC

原创 2016-11-06 16:32:03 · 3637 阅读 · 1 评论
Deep Learning of Binary Hash Codes for Fast Image Retrieval

Deep Learning of Binary Hash Codes for Fast Image Retrieval论文下载地址这是一篇台湾中研院发表在CVPR2015年的文章。之前deep hash，一般来说，网络根据图像的label，输入一个二元组或者三元组，利用CNN网络提取出图像的特征，根据相同的label应该具备比较接近的海明距离作为网络的优化目标，然后提出一种新的目标函数，采用

原创 2016-11-02 20:18:09 · 1801 阅读 · 2 评论
Simultaneous Feature Learning and Hash Coding with Deep Neural Networks

Simultaneous Feature Learning and Hash Coding with Deep Neural Networks论文下载地址自从2014年中山大学潘炎老师讲deep hash搬上舞台以来，关于deep hash的paper如雨后春笋般喷薄而出。本文也是潘炎老师15年参与发表的一篇paper，和之前的deep hash方法相比，本篇论文还是和先前的论文有着明显的改进。

原创 2016-10-23 22:15:57 · 3198 阅读 · 1 评论
Deep Hashing Network for Efficient Similarity Retrieval

Deep Hashing Network for Efficient Similarity RetrievalIntroduce这是发表在AAAI-2016的一篇paper，下载地址在本篇论文之前的监督Hash方法，第一步通过手动学习或者机器学习得到特征向量，第二步学习二进制的Hash Code。然而，这种方法存在明显的缺点，首先提取的特征并不一定完善，并且学习的二进制的Hash Code也有量

原创 2016-10-11 20:26:22 · 4503 阅读 · 1 评论
Supervised Hashing for Image Retrieval via Image Representation Learning

Supervised Hashing for Image Retrieval via Image Representation Learning背景最邻近搜索，是给定一个query，返回空间中距离query最近的点。最直接暴力的方法就是计算查询与特征空间的距离，并按照从小到大的顺序进行排序，返回结果。但是采取这种方法，存储的空间消耗比较大，并且查询时间慢。拿互联网的图片为例，数据规模基本都是上亿级别

原创 2016-09-26 21:41:04 · 3633 阅读 · 5 评论
Improved Techniques for Training GANs

Improved Techniques for Training GANspaper codeIntroduce对抗网络主要有两个应用：半监督学习和生成视觉相似图片。对抗网络的目的要训练生成网络G(z;θG)G(z;\theta^{G})，输入噪声zz生成x=G(z;θG)x=G(z;\theta^{G})，x为一幅图片，并且x满足真实的数据分布pdata(x)p_{data}(x)。判别网络D(

原创 2017-03-02 20:14:32 · 11544 阅读 · 8 评论
R-FCN: Object Detection via Region-based Fully Convolutional Networks

R-FCN: Object Detection via Region-based Fully Convolutional Networks论文下载地址源码地址本篇论文是微软亚研何凯明代季峰的团队做的工作，虽然何凯明16年去了facebook，但是相关工作还在进行，代码还是公布在github上。感兴趣的可以从链接下载源码进行分析测试。Introduce论文主要提出了一种利用全卷积网络进行目标检

原创 2016-11-30 20:15:37 · 5653 阅读 · 3 评论
G-CNN: an Iterative Grid Based Object Detector

G-CNN: an Iterative Grid Based Object DetectorIntroduce论文下载地址 G-CNN是CVPR16一篇关于目标检测的文章。从2016CVPR的文章可以看出目标检测的新的方法，去除Region Proposals。之前CNN做目标检测的方法，主要是RCNN，SPPNet，Fast-RCNN，Faster-RCNN等，这些方法基本都沿袭下面的思路：Cr

原创 2016-12-09 11:23:08 · 2154 阅读 · 0 评论
Instance-Aware Hashing for Multi-Label Image Retrieval

Instance-Aware Hashing for Multi-Label Image Retrieval出版源：《IEEE Transactions on Image Processing》, 2016, 25(6):1-1 论文下载地址Introduce本篇论文是发表在TIP的工作，主要讲述了深度学习在多目标数据集上生成hash code上的应用。深度学习用到的监督信息主要来源于人工标注，但

原创 2016-12-28 22:17:09 · 1358 阅读 · 0 评论
Inverted Multi-Index

Inverted Multi-Index简介Inverted Multi-index是Artem Babenko 和 Victor Lempitsky发表的一篇论文，论文起初发表在CVPR2012上，后来又增加了内容，又发表在2014的PAMI上，被引用的次数很高。论文地址如下所示： CVPR2012 PAMI 2014引言分析整篇文章，总结下来想法还是很直观。首先分析传统的倒排索引，在传统

原创 2016-09-14 23:13:17 · 3659 阅读 · 1 评论
Shortlist Selection with Residual-Aware Distance Estimator for K-Nearest Neighbor Search

Shortlist Selection with Residual-Aware Distance Estimator for K-Nearest Neighbor Search论文地址简介CVPR2016的一篇关于KNN搜索的paper。论文的主要贡献就是提出了关于shortlist计算的算法。在倒排索引的检索过程中，我们主要经过两步。第一：返回候选集。第二，采用更精确的距离度量风方式进行Reran

原创 2016-09-19 23:07:46 · 708 阅读 · 0 评论
Feature Learning Based Deep Supervised Hashing with Pairwise Labels

Feature Learning Based Deep Supervised Hashing with Pairwise Labels现在实验室要求每周阅读一篇paper然后写成总结，作为一个博客的受益者，我也想写成博客的形式，将收获不局限于分享在小组内。但是，作为一个知识的传播者，如果传播错误的知识误导别人还不如不做。所以写每一篇博客都是忐忑不安，特别是国内一些厉害课题组的发表的paper，生怕误

原创 2016-10-17 16:36:11 · 4662 阅读 · 2 评论
Factors in Finetuning Deep Model for Object Detection with Long-tail

Factors in Finetuning Deep Model for Object Detection with Long-tail论文下载地址第一次看到Long-tail这个字眼是在一本经济学的书本上，由美国经济学家克里斯·安德森提出。最近看CVPR16看到一篇关于Long-tail的文章，看到名字就被吸引了（论文起一个好名字很重要），很想知道长尾理论在深度学习的finetunning中有

原创 2016-12-06 17:23:01 · 1931 阅读 · 0 评论
DEEP COMPRESSION（深度学习网络参数压缩）

DEEP COMPRESSION: DEEP COMPRESSION: COMPRESSING DEEP NEURAL NETWORKS WITH PRUNING, TRAINED QUANTIZATION AND HUFFMAN CODING github 源码地址Introduce本篇论文是ICLR2016年的best paper，主要讲述关于深度学习网络参数的压缩工作。论文主要从下三点出发：

原创 2017-01-02 23:01:32 · 15937 阅读 · 11 评论
LAPGAN

Deep Generative Image Models using a Laplacian Pyramid of Adversarial Networkspaper codeIntroduce最近几年，对抗生成网络（GAN）在深度学习方面掀起了一股热潮，学术期刊会议上，关于对抗网络的文章层出不穷。从最开始goodfellow的gan，到 LapGan， Adversarial Autoencod

原创 2017-02-22 09:45:13 · 3244 阅读 · 0 评论
PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection

PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection论文地址 github源码Introduction这篇论文是发表在2016nips上的一篇关于目标检测的论文，在这个论文之前，目标检测我个人看到效果最好的是Faster R-CNN+++（R-FCN的对比试验,+++代表添加了迭代边框回归，上下文信息

原创 2016-12-18 11:07:20 · 2924 阅读 · 1 评论
A MultiPath Network for Object Detection

A MultiPath Network for Object Detection论文地址Introduce本篇论文是Facebook AI的工作，作者改进了目标检测的方法，在COCO数据集上进行实验，相比Seletive Search方法的fast R-CNN，将实验效果进一步提升了66%，在小物体上提高了4倍。作者的改进主要在以下三点：使用skip connections 融合多层的信息。使用

原创 2017-01-14 15:50:54 · 2308 阅读 · 0 评论
YOLO 论文解读

You Only Look Once:Unified, Real-Time Object Detection论文下载地址 github源码地址简介YOLO是2016年CVPR的paper，这是RGB继RCNN，fast-RCNN，faster-RCNN以后，又一力作。针对目标检测中，无法实现实时性检测的问题，独辟蹊径，开创了目标检测的新思路。在RCNN中，作者将目标检测的问题转化到分类上来，提出了

原创 2016-11-16 09:29:20 · 16119 阅读 · 4 评论

论文总结

作者: 南有乔木NTU

SSD: Single Shot MultiBox Detector

基于深度学习的目标检测研究进展

Fast-RCNN

Deep Learning of Binary Hash Codes for Fast Image Retrieval

Simultaneous Feature Learning and Hash Coding with Deep Neural Networks

Deep Hashing Network for Efficient Similarity Retrieval

Supervised Hashing for Image Retrieval via Image Representation Learning

Improved Techniques for Training GANs

R-FCN: Object Detection via Region-based Fully Convolutional Networks

G-CNN: an Iterative Grid Based Object Detector

Instance-Aware Hashing for Multi-Label Image Retrieval

Inverted Multi-Index

Shortlist Selection with Residual-Aware Distance Estimator for K-Nearest Neighbor Search

Feature Learning Based Deep Supervised Hashing with Pairwise Labels

Factors in Finetuning Deep Model for Object Detection with Long-tail

DEEP COMPRESSION（深度学习网络参数压缩）

LAPGAN

PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection

A MultiPath Network for Object Detection

YOLO 论文解读