ZJ
cv_family_z
这个作者很懒,什么都没留下…
展开
-
目标检测--PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection
https://www.arxiv.org/abs/1608.08021本文针对多种类目标检测这个问题,结合当前各种最新技术成果,达到很好的结果。针对整体检测框架:CNN feature extraction + region proposal + RoI classification 我们主要优化 feature extraction,因为 region proposal part 速度比较快原创 2016-09-05 10:53:42 · 9690 阅读 · 1 评论 -
行人检测-Pedestrian Detection Inspired by Appearance Constancy and Shape Symmetry
CVPR 2016 关于行人检测的文献 手工设计特征,然后训练分类器进行行人检测。3 Our methods 3.1. Appearance constancy and shape symmetry这里提出了两个关于行人的特点 Appearance constancy 在水平方向,人体内的纹理基本相似,与背景有一定差异。 shape symmetry 人体在水平方向具有一定的对称性原创 2016-08-19 14:14:51 · 2113 阅读 · 0 评论 -
行人检测 Is Faster R-CNN Doing Well for Pedestrian Detection?
ECCV 2016本文主要是分析了一下Faster R-CNN用于行人检测效果不好的原因,并对比提出了解决方案。 Faster R-CNN用于行人检测效果不好的原因有两个: 1)行人在图像中的尺寸较小,(e.g., 28×70 for Caltech),对于小物体, Region-of-Interest (RoI) pooling layer 在 low-resolution feature原创 2016-09-01 10:44:19 · 9297 阅读 · 4 评论 -
图像检索--Deep Supervised Hashing for Fast Image Retrieval
CVPR2016 Deep Supervised Hashing for Fast Image Retrieval源代码: http://vipl.ict.ac.cn/resources/codes 网页打不开啊本文使用CNN网络来完成快速图像检索。 image feature extraction and binary code learning本文的网络结构如下:三个卷积层,两个全连接层,对原创 2016-09-08 14:30:38 · 8618 阅读 · 0 评论 -
The Global Patch Collider
CVPR2016 The Global Patch Collider本文提出了一个快速的算法,用于建立图像对中的全局对应关系。 global point-wise correspondences in images and videos。这里主要使用多个学习到的树结构来进行搜索匹配的。每个图像块会遍历决策森林中的每个树,到达树的不同叶子节点。如果从源图像和目标图像中的图像块在所有的树中都位于同原创 2016-08-03 09:33:39 · 1919 阅读 · 0 评论 -
BoxCars: 3D Boxes as CNN Input for Improved Fine-Grained Vehicle Recognition
CVPR 2016 本文没有开源代码相关文档和代码 https://medusa.fit.vutbr.cz/traffic/research-topics/fine-grained-vehicle-recognition/unsupervised-processing-of-vehicle-appearance-for-automatic-understanding-in-traffic原创 2016-08-17 15:38:08 · 3589 阅读 · 0 评论 -
Shallow and Deep Convolutional Networks for Saliency Prediction
CVPR 2016 Shallow and Deep Convolutional Networks for Saliency Prediction CNN网络 用于 显著性预测开源代码 : https://github.com/imatge-upc/saliency-2016-cvpr本文针对显著性预测问题,提出了两个CNN网络,一个小的模型,一个较深的模型。视觉显著性指智能算法通过模拟人的原创 2016-08-02 15:33:04 · 2582 阅读 · 1 评论 -
Deep Residual Learning for Image Recognition
这是微软方面的最新研究成果, 在第六届ImageNet年度图像识别测试中,微软研究院的计算机图像识别系统在几个类别的测试中获得第一名。本文是解决超深度CNN网络训练问题,152层及尝试了1000层。随着CNN网络的发展,尤其的VGG网络的提出,大家发现网络的层数是一个关键因素,貌似越深的网络效果越好。但是随着网络层数的增加,问题也随之而来。首先一个问题是 vanishing/exploding g原创 2015-12-16 15:13:37 · 14847 阅读 · 1 评论 -
Canny Text Detector: Fast and Robust Scene Text Localization Algorithm
CVPR 2016本文主要是解决图像中的文字定位问题的。将每个文字看做 Canny 算法中的边缘像素,用 Canny 边缘提取的思路来检测文字。先上图看一下我们算法和其他算法的对比:算法的流程如下:1)使用一个 MSER变体算法提取字符候选区域。 2)每个候选字符使用 AdaBoost classifier 评估一下,这里使用了双阈值, 得到强候选字符和弱候选字符 3)根据字符规则出原创 2016-08-17 09:20:57 · 3300 阅读 · 1 评论 -
CoMaL: Good Features to Match on Object Boundaries
CVPR 2016 用于匹配的边界位置角点特征提取CoMaL: Good Features to Match on Object Boundaries本文主要在物体边缘位置找出适合于匹配跟踪的好的特征。传统的特征方法在物体边缘位置效果不好,主要是因为背景在变化。如下图所示:本文针对物体边缘位置,利用 Maximally Stable Extremal Regions(MSER) 提出了 Ma原创 2016-08-02 11:10:42 · 1041 阅读 · 0 评论 -
Anticipating Visual Representations from Unlabeled Video
CVPR 2016 Anticipating Visual Representations from Unlabeled Videohttp://www.guokr.com/article/441589/预测未来? 本文使用CNN网络,通过学习大量未标记视频数据,来预测未来发生的事情。虽然效果不完美,但是方向还是很吸引人的,相信不远的将来该方向会有更大的进步。本文的网络结构如下: 因为未来具有多原创 2016-08-01 16:35:40 · 1242 阅读 · 0 评论 -
How Far are We from Solving Pedestrian Detection?
CVPR 2016 我们离解决行人检测问题到底还有多远?How Far are We from Solving Pedestrian Detection? 项目网页:https://www.mpi-inf.mpg.de/departments/computer-vision-and-multimodal-computing/research/people-detection-pose-estim原创 2016-08-04 15:25:35 · 2836 阅读 · 0 评论 -
Fast Detection of Curved Edges at Low SNR
CVPR 2016 低信号噪声比图像中曲线边缘快速检测http://www.wisdom.weizmann.ac.il/~yehonato/projectPage.html有源代码本文针对低信号噪声比图像 曲线边缘检测主要思路如下: 1)An efficient hierarchical algorithm to examine an exponential number of candid原创 2016-08-04 11:09:24 · 2135 阅读 · 3 评论 -
Object Contour Detection with a Fully Convolutional Encoder-Decoder Network
CVPR 2016 使用 CNN 网络进行 物体轮廓提取Object Contour Detection with a Fully Convolutional Encoder-Decoder Network我们将轮廓检测问题看做一个图像二值标记问题。 We formulate contour detection as a binary image labeling problem where原创 2016-08-04 10:46:31 · 4427 阅读 · 0 评论 -
Beyond Local Search: Tracking Objects Everywhere with Instance-Specific Proposals
CVPR 2016Beyond Local Search: Tracking Objects Everywhere with Instance-Specific Proposals本文主要解决快速运动物体的跟踪问题,以前大部分跟踪的方法都会在通过一个运动模型预测下一帧物体可能的位置,在其局部区域进行搜索匹配。该方法有两个个前提就是:1)物体被正确跟踪,2)运动不是太快。有时物体变形也会对其产生影响原创 2016-08-04 09:26:45 · 2478 阅读 · 5 评论 -
From Keyframes to Key Objects: Video Summarization by Representative Object Proposal Selection
CVPR2016From Keyframes to Key Objects: Video Summarization by Representative Object Proposal Selection本文主要针对视频摘要,从关键帧中提取出关键物体。本文主要思路如下:针对每个关键帧,使用 Edge Boxes 提取 物体候选区域,然后将所有的候选区域集中在一起,提取特征,使用优化方法,找出代表性原创 2016-08-03 16:01:17 · 1387 阅读 · 0 评论 -
A Deeper Look at Saliency: Feature Contrast, Semantics, and Beyond
CVPR2016 A Deeper Look at Saliency: Feature Contrast, Semantics, and Beyond本文首先解决的问题是在设计 visual saliency 模型时,关注的是 high level considerations,然后就是提出了一个 基于 全卷积网络的 FCNs 深度模型,同时指出在训练数据的选择,真值数据的使用上对最终结果至关原创 2016-08-03 14:27:27 · 1278 阅读 · 0 评论 -
Latent Embeddings for Zero-shot Classification
CVPR2016Latent Embeddings for Zero-shot Classification本文还是针对 zero-shot classification 问题。以前基于 structured embedding frameworks 解决这个问题的思路主要如下:首先将 图像和 类别信息映射到某些多维向量空间。 一般图像的嵌入信息( Image embeddings )通过 CNN原创 2016-07-29 16:52:56 · 2749 阅读 · 0 评论 -
Efficient Coarse-to-Fine PatchMatch for Large Displacement Optical Flow
CVPR 2016 本文提出了一个快速计算大位移光流的算法。 一般的算法在 tiny structures with large motions 情况下容易出现误差。算法采用多尺度框架,不同尺度可以提取出不同的信息。 两幅图像 I1,I2,从I1里提取一系列种子点。网格提取,每个d*d区域只有一个种子点。 然后从顶层开始,建立种子点的对应关系。然后根据上层的对应关系计算下一层的对应关系。原创 2016-08-30 14:48:50 · 2588 阅读 · 1 评论 -
激活函数-Concatenated Rectified Linear Units
ICML2016Understanding and Improving Convolutional Neural Networks via Concatenated Rectified Linear Units本文在深入分析CNN网络内部结构,发现在CNN网络的前几层学习到的滤波器中存在负相关。 they appear surprisingly opposite to each other,原创 2016-09-01 15:09:54 · 5845 阅读 · 0 评论 -
行人检索 Learning a Discriminative Null Space for Person Re-identification
CVPR 2016 code: http://www.eecs.qmul.ac.uk/~lz/当前行人检索问题主要关注于 learning the optimal distance metrics,减少同类距离,扩大异类距离。一般来说一个行人的外表用几千维向量来表示其特征,同一个人一般只有几百个样本(主要是以为收集样本比较困难),所以存在 the classic small sample si原创 2016-08-23 09:55:05 · 2780 阅读 · 2 评论 -
BinaryConnect: Training Deep Neural Networks with binary weights during propagations
BinaryConnect : Training Deep Neural Networks with binary weights during propagationsCode: https://github.com/MatthieuCourbariaux/BinaryConnect当前CNN网络主要的运算集中在 实数权值乘以实数激活量或 者 实数权值乘以实数梯度。本文提出 BinaryCon原创 2016-11-14 14:43:25 · 3916 阅读 · 0 评论 -
人脸识别 - A Discriminative Feature Learning Approach for Deep Face Recognition
A Discriminative Feature Learning Approach for Deep Face Recognition ECCV 2016code: https://github.com/ydwen/caffe-face本文针对人脸识别问题,针对 loss function提出了加入 center loss,使得学习到地 深度特征更加 discriminative 。以前CNN原创 2016-10-17 10:10:37 · 7097 阅读 · 6 评论 -
大裕量Softmax 损失函数--Large-Margin Softmax Loss for Convolutional Neural Networks
ICML2016 Large-Margin Softmax Loss for Convolutional Neural Networks本文针对CNN网络中的 Softmax Loss 做出改进,使之成为 Large-Margin Softmax Loss 标准的CNN可以被看做由 Softmax Loss 监督的卷积特征学习机器。当前的 Softmax Loss 没有显式的强调 intra-原创 2016-10-17 16:10:19 · 5186 阅读 · 0 评论 -
CNN网络分解--Factorized Convolutional Neural Networks
ICML2016本文主要针对CNN网络的卷积运算进行深入分析,简化卷积运算。 Our model achieves accuracy of GoogLeNet while consuming 3.4 times less computation 本文和以前CNN网络简化工作最大的不同在于,以前都需要预训练完整的模型,在这个基础上简化完整模型,然后再微调简化后的模型。This limitation原创 2016-09-07 10:50:27 · 4813 阅读 · 0 评论 -
噪声数据-The Unreasonable Effectiveness of Noisy Data for Fine-Grained Recognition
ECCV 2016 The Unreasonable Effectiveness of Noisy Data for Fine-Grained Recognition当前 fine-grained recognition的主流方法分两步:1)训练数据的收集和标定,2)模型的训练。本文提出的使用从网络上搜索的含有噪声的数据进行训练,得到很好的效果。3 Noisy Fine-Grained Data原创 2016-10-24 16:44:35 · 2530 阅读 · 0 评论 -
CNN网络结构 - Refining Architectures of Deep Convolutional Neural Networks
CVPR 2016 Refining Architectures of Deep Convolutional Neural Networks本文的出发点是回答下面的问题: is the selected CNN optimal for the dataset in terms of accuracy and model size? 针对一个问题,我们使用CNN模型,针对现有的数据库,我们选择的C原创 2016-10-28 15:58:29 · 1470 阅读 · 2 评论 -
CNN网络量化 - Quantized Convolutional Neural Networks for Mobile Devices
Quantized Convolutional Neural Networks for Mobile DevicesCVPR2016GitHub code: https://github.com/jiaxiang-wu/quantized-cnn本文主要是通过对CNN网络的量化,达到压缩模型大小及加快速度的目的,牺牲的准确率比较小。CNN网络在 test phase , 运算时间主要消耗在卷积层,C原创 2016-08-24 14:35:27 · 10097 阅读 · 4 评论 -
视频目标检测 - Object Detection from Video Tubelets with Convolutional Neural Networks
CVPR2016code: https://github.com/myfavouritekk/vdetlib基于静态图像的CNN目标检测问题已经很多人研究。而基于视频的CNN目标检测问题则是刚刚起步。主要问题是目标检测和跟踪的有效结合。针对视频中的目标,单独的检测和单独的跟踪都会有波动。我们的视频目标检测框架图: 主要包括两个模块: 1 a spatio-temporal tubelet p原创 2016-10-20 15:28:01 · 13340 阅读 · 4 评论 -
行人检索 - Top-push Video-based Person Re-identification
CVPR2016code: http://isee.sysu.edu.cn/resource本文针对 Person Re-identification 问题 做了两个方面的工作:一个是基于视频信息来做,主要是提取更多时空的信息来解决遮挡和复杂的背景干扰。第二是引入Top-push优化手段 来 增大类间差异,缩小类内差异。3 Approach 我们使用 HOG3D 描述子 来提取 视频中的时空信息原创 2016-10-20 09:14:22 · 2890 阅读 · 0 评论 -
CNN网络二值化--XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks
XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks本文主要是简化CNN网络,使得CNN网络能够在CPU实时跑起来,但是会牺牲一些精度。本文提出了两个不同的简化网络 :Binary-Weight-Networks 和 XNOR-Networks。Binary-Weight-Networks 只是对CN原创 2016-07-15 13:55:07 · 12435 阅读 · 0 评论 -
去雾 - Non-Local Image Dehazing
CVPR2016Non-Local Image Dehazing code: http://www.eng.tau.ac.il/~berman/NonLocalDehazing/简单明了的图像去雾算法。首先一幅彩色图像的RGB颜色值可以通过几百个RGB值来表示,类似图像压缩中的调色板。一幅没有雾的彩色图像近似RGB值在 RGB空间分布为一个 cluster,但是在有雾的彩色图像这些RGB值在RGB原创 2016-10-18 15:43:52 · 10648 阅读 · 1 评论 -
行人检索 - Embedding Deep Metric for Person Re-identification
ECCV 2016code: http://www.cbsr.ia.ac.cn/users/hailinshi/Embedding Deep Metric for Person Re-identification: A Study Against Large Variations针对行人检索问题,这里主要做了两个方向的工作:1)针对大家使用的hard negative mining 策略,我们提出原创 2016-10-21 09:59:01 · 2404 阅读 · 2 评论 -
物体跟踪-Fully-Convolutional Siamese Networks for Object Tracking
项目网页 http://www.robots.ox.ac.uk/~luca/siamese-fc.html 开源代码: https://github.com/bertinetto/siamese-fc本文将一个全卷积 Siamese 网络嵌入到一个简单的跟踪算法中,使其跟踪效果很好,速度很快。该 Siamese 网络使用的训练数据是 ILSVRC15 数据库中用于目标检测的视频。针对任意目标跟踪问原创 2016-09-20 15:15:17 · 7416 阅读 · 5 评论 -
Learning Compact Binary Descriptors with Unsupervised Deep Neural Networks
CVPR2016 开源代码: https://github.com/kevinlin311tw/cvpr16-deepbit本文通过深度学习网络来学习 Compact Binary Descriptors , 亮点是 Unsupervised,在优化函数里面加入了三个约束: 1) minimal loss quantization 2) evenly distributed codes原创 2016-09-19 14:53:03 · 2017 阅读 · 1 评论 -
人脸识别 - Sparsifying Neural Network Connections for Face Recognition
CVPR2016 香港中文大学人脸识别研究Sparsifying Neural Network Connections for Face Recognition本文主要思路是先训练一个 Baseline ConvNet structures,VGG模型的。然后对这个结果进行逐层 sparse,从全连接层到卷积层。每 sparse 一层,就训练一下。最后得到一个 sparse CNN 模型。Insp原创 2016-08-26 15:06:36 · 2579 阅读 · 1 评论 -
人脸识别 -Do We Really Need to Collect Millions of Faces for Effective Face Recognition?
ECCV 2016Do We Really Need to Collect Millions of Faces for Effective Face Recognition?http://www.openu.ac.il/home/hassner/projects/augmented_faces/Code, trained CNN models and data is coming!本文针对人脸训练原创 2016-08-25 15:47:19 · 2824 阅读 · 1 评论 -
人脸识别 - Pose-Aware Face Recognition in the Wild
CVPR 2016 本文作者提供了 训练好的 CNN模型本文主要侧重解决人脸识别中的姿态问题。由 图1 可以看出,LFW数据中人脸的角度集中在 正负20度,而 IJB-A数据库中的角度分部则比较宽。这种大角度人脸识别难度比较大。本文首先对人脸的角度进行分类,然后再用对应角度的CNN网络 进行人脸识别。针对人脸,我们采用了 multi-alignment策略: 2D in-plane align原创 2016-08-25 09:33:31 · 4105 阅读 · 2 评论 -
SSD: Single Shot MultiBox Detector
本文算是 Faster R-CNN, YOLO 算法的改进版吧,它将检测和分类融合到一起去了,对每个可能的检测框赋予一个类别的概率。本文的速度到底有多快,也没说啊我们将整个特征层分为 4*4 , 8*8 个网格,对每个网格位置,计算可能类别可能尺寸的概率,prior。 三个类别的检测效果 PASCAL VOC2012 test detection results原创 2016-01-07 10:50:15 · 14836 阅读 · 4 评论 -
Multi-Cue Zero-Shot Learning with Strong Supervision
zero-shot learning for visual recognition aims at equipping computer vision systems to recognize novel classes without a single training example这里科普一下什么叫 zero-shot learning ,就是以前训练样本中没见过一个类别的物体,现在希望能够识原创 2016-07-29 10:23:10 · 1011 阅读 · 0 评论