CVPR 2016
cv_family_z
这个作者很懒,什么都没留下…
展开
-
Exploit All the Layers: Fast and Accurate CNN Object Detector with Scale Dependent Pooling 之再阅读
CVPR2016Exploit All the Layers: Fast and Accurate CNN Object Detector with Scale Dependent Pooling and Cascaded Rejection Classifiers本文对基于CNN的物体检测提出了两个技巧来提高速度和精度: 1) scale-dependent pooling (SDP) 就是根原创 2016-07-25 11:39:07 · 2331 阅读 · 2 评论 -
Shallow and Deep Convolutional Networks for Saliency Prediction
CVPR 2016 Shallow and Deep Convolutional Networks for Saliency Prediction CNN网络 用于 显著性预测开源代码 : https://github.com/imatge-upc/saliency-2016-cvpr本文针对显著性预测问题,提出了两个CNN网络,一个小的模型,一个较深的模型。视觉显著性指智能算法通过模拟人的原创 2016-08-02 15:33:04 · 2642 阅读 · 1 评论 -
BoxCars: 3D Boxes as CNN Input for Improved Fine-Grained Vehicle Recognition
CVPR 2016 本文没有开源代码相关文档和代码 https://medusa.fit.vutbr.cz/traffic/research-topics/fine-grained-vehicle-recognition/unsupervised-processing-of-vehicle-appearance-for-automatic-understanding-in-traffic原创 2016-08-17 15:38:08 · 3607 阅读 · 0 评论 -
The Global Patch Collider
CVPR2016 The Global Patch Collider本文提出了一个快速的算法,用于建立图像对中的全局对应关系。 global point-wise correspondences in images and videos。这里主要使用多个学习到的树结构来进行搜索匹配的。每个图像块会遍历决策森林中的每个树,到达树的不同叶子节点。如果从源图像和目标图像中的图像块在所有的树中都位于同原创 2016-08-03 09:33:39 · 1932 阅读 · 0 评论 -
图像检索--Deep Supervised Hashing for Fast Image Retrieval
CVPR2016 Deep Supervised Hashing for Fast Image Retrieval源代码: http://vipl.ict.ac.cn/resources/codes 网页打不开啊本文使用CNN网络来完成快速图像检索。 image feature extraction and binary code learning本文的网络结构如下:三个卷积层,两个全连接层,对原创 2016-09-08 14:30:38 · 8652 阅读 · 0 评论 -
行人检测 Is Faster R-CNN Doing Well for Pedestrian Detection?
ECCV 2016本文主要是分析了一下Faster R-CNN用于行人检测效果不好的原因,并对比提出了解决方案。 Faster R-CNN用于行人检测效果不好的原因有两个: 1)行人在图像中的尺寸较小,(e.g., 28×70 for Caltech),对于小物体, Region-of-Interest (RoI) pooling layer 在 low-resolution feature原创 2016-09-01 10:44:19 · 9309 阅读 · 4 评论 -
行人检测-Pedestrian Detection Inspired by Appearance Constancy and Shape Symmetry
CVPR 2016 关于行人检测的文献 手工设计特征,然后训练分类器进行行人检测。3 Our methods 3.1. Appearance constancy and shape symmetry这里提出了两个关于行人的特点 Appearance constancy 在水平方向,人体内的纹理基本相似,与背景有一定差异。 shape symmetry 人体在水平方向具有一定的对称性原创 2016-08-19 14:14:51 · 2122 阅读 · 0 评论 -
Efficient Coarse-to-Fine PatchMatch for Large Displacement Optical Flow
CVPR 2016 本文提出了一个快速计算大位移光流的算法。 一般的算法在 tiny structures with large motions 情况下容易出现误差。算法采用多尺度框架,不同尺度可以提取出不同的信息。 两幅图像 I1,I2,从I1里提取一系列种子点。网格提取,每个d*d区域只有一个种子点。 然后从顶层开始,建立种子点的对应关系。然后根据上层的对应关系计算下一层的对应关系。原创 2016-08-30 14:48:50 · 2601 阅读 · 1 评论 -
行人检索 Learning a Discriminative Null Space for Person Re-identification
CVPR 2016 code: http://www.eecs.qmul.ac.uk/~lz/当前行人检索问题主要关注于 learning the optimal distance metrics,减少同类距离,扩大异类距离。一般来说一个行人的外表用几千维向量来表示其特征,同一个人一般只有几百个样本(主要是以为收集样本比较困难),所以存在 the classic small sample si原创 2016-08-23 09:55:05 · 2794 阅读 · 2 评论 -
人脸识别 - Pose-Aware Face Recognition in the Wild
CVPR 2016 本文作者提供了 训练好的 CNN模型本文主要侧重解决人脸识别中的姿态问题。由 图1 可以看出,LFW数据中人脸的角度集中在 正负20度,而 IJB-A数据库中的角度分部则比较宽。这种大角度人脸识别难度比较大。本文首先对人脸的角度进行分类,然后再用对应角度的CNN网络 进行人脸识别。针对人脸,我们采用了 multi-alignment策略: 2D in-plane align原创 2016-08-25 09:33:31 · 4131 阅读 · 2 评论 -
人脸识别 -Do We Really Need to Collect Millions of Faces for Effective Face Recognition?
ECCV 2016Do We Really Need to Collect Millions of Faces for Effective Face Recognition?http://www.openu.ac.il/home/hassner/projects/augmented_faces/Code, trained CNN models and data is coming!本文针对人脸训练原创 2016-08-25 15:47:19 · 2843 阅读 · 1 评论 -
人脸识别 - Sparsifying Neural Network Connections for Face Recognition
CVPR2016 香港中文大学人脸识别研究Sparsifying Neural Network Connections for Face Recognition本文主要思路是先训练一个 Baseline ConvNet structures,VGG模型的。然后对这个结果进行逐层 sparse,从全连接层到卷积层。每 sparse 一层,就训练一下。最后得到一个 sparse CNN 模型。Insp原创 2016-08-26 15:06:36 · 2600 阅读 · 1 评论 -
Learning Compact Binary Descriptors with Unsupervised Deep Neural Networks
CVPR2016 开源代码: https://github.com/kevinlin311tw/cvpr16-deepbit本文通过深度学习网络来学习 Compact Binary Descriptors , 亮点是 Unsupervised,在优化函数里面加入了三个约束: 1) minimal loss quantization 2) evenly distributed codes原创 2016-09-19 14:53:03 · 2034 阅读 · 1 评论 -
去雾 - Non-Local Image Dehazing
CVPR2016Non-Local Image Dehazing code: http://www.eng.tau.ac.il/~berman/NonLocalDehazing/简单明了的图像去雾算法。首先一幅彩色图像的RGB颜色值可以通过几百个RGB值来表示,类似图像压缩中的调色板。一幅没有雾的彩色图像近似RGB值在 RGB空间分布为一个 cluster,但是在有雾的彩色图像这些RGB值在RGB原创 2016-10-18 15:43:52 · 10734 阅读 · 1 评论 -
行人检索 - Top-push Video-based Person Re-identification
CVPR2016code: http://isee.sysu.edu.cn/resource本文针对 Person Re-identification 问题 做了两个方面的工作:一个是基于视频信息来做,主要是提取更多时空的信息来解决遮挡和复杂的背景干扰。第二是引入Top-push优化手段 来 增大类间差异,缩小类内差异。3 Approach 我们使用 HOG3D 描述子 来提取 视频中的时空信息原创 2016-10-20 09:14:22 · 2903 阅读 · 0 评论 -
视频目标检测 - Object Detection from Video Tubelets with Convolutional Neural Networks
CVPR2016code: https://github.com/myfavouritekk/vdetlib基于静态图像的CNN目标检测问题已经很多人研究。而基于视频的CNN目标检测问题则是刚刚起步。主要问题是目标检测和跟踪的有效结合。针对视频中的目标,单独的检测和单独的跟踪都会有波动。我们的视频目标检测框架图: 主要包括两个模块: 1 a spatio-temporal tubelet p原创 2016-10-20 15:28:01 · 13356 阅读 · 4 评论 -
CNN网络量化 - Quantized Convolutional Neural Networks for Mobile Devices
Quantized Convolutional Neural Networks for Mobile DevicesCVPR2016GitHub code: https://github.com/jiaxiang-wu/quantized-cnn本文主要是通过对CNN网络的量化,达到压缩模型大小及加快速度的目的,牺牲的准确率比较小。CNN网络在 test phase , 运算时间主要消耗在卷积层,C原创 2016-08-24 14:35:27 · 10122 阅读 · 4 评论 -
Deep Residual Learning for Image Recognition
这是微软方面的最新研究成果, 在第六届ImageNet年度图像识别测试中,微软研究院的计算机图像识别系统在几个类别的测试中获得第一名。本文是解决超深度CNN网络训练问题,152层及尝试了1000层。随着CNN网络的发展,尤其的VGG网络的提出,大家发现网络的层数是一个关键因素,貌似越深的网络效果越好。但是随着网络层数的增加,问题也随之而来。首先一个问题是 vanishing/exploding g原创 2015-12-16 15:13:37 · 14867 阅读 · 1 评论 -
Canny Text Detector: Fast and Robust Scene Text Localization Algorithm
CVPR 2016本文主要是解决图像中的文字定位问题的。将每个文字看做 Canny 算法中的边缘像素,用 Canny 边缘提取的思路来检测文字。先上图看一下我们算法和其他算法的对比:算法的流程如下:1)使用一个 MSER变体算法提取字符候选区域。 2)每个候选字符使用 AdaBoost classifier 评估一下,这里使用了双阈值, 得到强候选字符和弱候选字符 3)根据字符规则出原创 2016-08-17 09:20:57 · 3316 阅读 · 1 评论 -
CoMaL: Good Features to Match on Object Boundaries
CVPR 2016 用于匹配的边界位置角点特征提取CoMaL: Good Features to Match on Object Boundaries本文主要在物体边缘位置找出适合于匹配跟踪的好的特征。传统的特征方法在物体边缘位置效果不好,主要是因为背景在变化。如下图所示:本文针对物体边缘位置,利用 Maximally Stable Extremal Regions(MSER) 提出了 Ma原创 2016-08-02 11:10:42 · 1052 阅读 · 0 评论 -
DisturbLabel: Regularizing CNN on the Loss Layer
CVPR 2016本文针对 CNN模型正则化提出了一个简单的算法:DisturbLabel , 就是在每次迭代过程中,我们随机选择一些样本,使用错误的标记值进行训练。我们发现这个简单的方法可以很好的防止CNN模型过拟合。并且可以和 Dropout 一起使用得到更好的效果。原创 2016-07-25 11:25:29 · 1658 阅读 · 0 评论 -
The MegaFace Benchmark-1 Million Faces for Recognition at Scale
CVPR2016 MegaFace data, code, and challenge can be found at: http://megaface.cs.washington.edu人脸识别问题貌似已经被解决了,因为在 LFW上面,大家的识别率都是 99%+啦。但是当数据库的规模达到一百万时,识别率就不是很好了。http://www.leiphone.com/news/201606/X转载 2016-07-20 16:39:43 · 3184 阅读 · 1 评论 -
Generation and Comprehension of Unambiguous Object Descriptions
CVPR 2016https://github.com/mjhucla/Google_Refexp_toolbox本文主要包括两个模块,一个是描述生成,Description Generation ,对于图像中一个区域或特定物体会生成一个没有歧义的描述(known as a referring expression)。另一个模块是 描述理解 Description Comprehension,给定一原创 2016-07-26 11:27:18 · 1920 阅读 · 0 评论 -
Image Question Answering using Convolutional Neural Networ with Dynamic Parameter Prediction
CVPR2016Image Question Answering using Convolutional Neural Networ with Dynamic Parameter Prediction项目网页 http://cvlab.postech.ac.kr/research/dppnet/开源代码 https://github.com/HyeonwooNoh/DPPnet本文主要使用 CN原创 2016-07-27 10:11:33 · 804 阅读 · 0 评论 -
Neural Module Networks
Neural Module Networks CVPR2016开源代码 http://github.com/jacobandreas/nmn2本文也是针对 Visual question answering 这个问题的,还是用 CNN网络,这里使用一个语义解析器(natural language parser)来动态的决定一个CNN网络,CNN网络有几个模块过程,通过语义解析器,我们动原创 2016-07-27 11:15:48 · 2364 阅读 · 0 评论 -
Stacked Attention Networks for Image Question Answering
CVPR2016 Stacked Attention Networks for Image Question Answering code : https://github.com/zcyang/imageqa-san本文针对 image question answering (QA)问题 提出了一个 stacked attention networks (SANs) 网络。3 Sta原创 2016-07-28 09:23:56 · 1716 阅读 · 0 评论 -
Learning Deep Representations of Fine-Grained Visual Descriptions
CVPR2016 Learning Deep Representations of Fine-Grained Visual Descriptionscode: https://github.com/reedscot/cvpr2016本文提出了一个模型,可以用来干什么了?就是给你一句话,搜出满足这句话的图像怎么实现这个目标了? 分别对图像 和 语句使用 CNN网络,提取出对应的特征,然后结合起来原创 2016-07-29 09:24:59 · 3866 阅读 · 0 评论 -
Multi-Cue Zero-Shot Learning with Strong Supervision
zero-shot learning for visual recognition aims at equipping computer vision systems to recognize novel classes without a single training example这里科普一下什么叫 zero-shot learning ,就是以前训练样本中没见过一个类别的物体,现在希望能够识原创 2016-07-29 10:23:10 · 1027 阅读 · 0 评论 -
Latent Embeddings for Zero-shot Classification
CVPR2016Latent Embeddings for Zero-shot Classification本文还是针对 zero-shot classification 问题。以前基于 structured embedding frameworks 解决这个问题的思路主要如下:首先将 图像和 类别信息映射到某些多维向量空间。 一般图像的嵌入信息( Image embeddings )通过 CNN原创 2016-07-29 16:52:56 · 2792 阅读 · 0 评论 -
A Deeper Look at Saliency: Feature Contrast, Semantics, and Beyond
CVPR2016 A Deeper Look at Saliency: Feature Contrast, Semantics, and Beyond本文首先解决的问题是在设计 visual saliency 模型时,关注的是 high level considerations,然后就是提出了一个 基于 全卷积网络的 FCNs 深度模型,同时指出在训练数据的选择,真值数据的使用上对最终结果至关原创 2016-08-03 14:27:27 · 1291 阅读 · 0 评论 -
From Keyframes to Key Objects: Video Summarization by Representative Object Proposal Selection
CVPR2016From Keyframes to Key Objects: Video Summarization by Representative Object Proposal Selection本文主要针对视频摘要,从关键帧中提取出关键物体。本文主要思路如下:针对每个关键帧,使用 Edge Boxes 提取 物体候选区域,然后将所有的候选区域集中在一起,提取特征,使用优化方法,找出代表性原创 2016-08-03 16:01:17 · 1392 阅读 · 0 评论 -
Beyond Local Search: Tracking Objects Everywhere with Instance-Specific Proposals
CVPR 2016Beyond Local Search: Tracking Objects Everywhere with Instance-Specific Proposals本文主要解决快速运动物体的跟踪问题,以前大部分跟踪的方法都会在通过一个运动模型预测下一帧物体可能的位置,在其局部区域进行搜索匹配。该方法有两个个前提就是:1)物体被正确跟踪,2)运动不是太快。有时物体变形也会对其产生影响原创 2016-08-04 09:26:45 · 2498 阅读 · 5 评论 -
Object Contour Detection with a Fully Convolutional Encoder-Decoder Network
CVPR 2016 使用 CNN 网络进行 物体轮廓提取Object Contour Detection with a Fully Convolutional Encoder-Decoder Network我们将轮廓检测问题看做一个图像二值标记问题。 We formulate contour detection as a binary image labeling problem where原创 2016-08-04 10:46:31 · 4455 阅读 · 0 评论 -
Fast Detection of Curved Edges at Low SNR
CVPR 2016 低信号噪声比图像中曲线边缘快速检测http://www.wisdom.weizmann.ac.il/~yehonato/projectPage.html有源代码本文针对低信号噪声比图像 曲线边缘检测主要思路如下: 1)An efficient hierarchical algorithm to examine an exponential number of candid原创 2016-08-04 11:09:24 · 2152 阅读 · 3 评论 -
How Far are We from Solving Pedestrian Detection?
CVPR 2016 我们离解决行人检测问题到底还有多远?How Far are We from Solving Pedestrian Detection? 项目网页:https://www.mpi-inf.mpg.de/departments/computer-vision-and-multimodal-computing/research/people-detection-pose-estim原创 2016-08-04 15:25:35 · 2849 阅读 · 0 评论 -
Anticipating Visual Representations from Unlabeled Video
CVPR 2016 Anticipating Visual Representations from Unlabeled Videohttp://www.guokr.com/article/441589/预测未来? 本文使用CNN网络,通过学习大量未标记视频数据,来预测未来发生的事情。虽然效果不完美,但是方向还是很吸引人的,相信不远的将来该方向会有更大的进步。本文的网络结构如下: 因为未来具有多原创 2016-08-01 16:35:40 · 1258 阅读 · 0 评论 -
CNN网络结构 - Refining Architectures of Deep Convolutional Neural Networks
CVPR 2016 Refining Architectures of Deep Convolutional Neural Networks本文的出发点是回答下面的问题: is the selected CNN optimal for the dataset in terms of accuracy and model size? 针对一个问题,我们使用CNN模型,针对现有的数据库,我们选择的C原创 2016-10-28 15:58:29 · 1493 阅读 · 2 评论