自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 论坛 (1)

原创 Latent Embeddings for Zero-shot Classification

CVPR2016Latent Embeddings for Zero-shot Classification本文还是针对 zero-shot classification 问题。以前基于 structured embedding frameworks 解决这个问题的思路主要如下:首先将 图像和 类别信息映射到某些多维向量空间。 一般图像的嵌入信息( Image embeddings )通过 CNN

2016-07-29 16:52:56 1940

原创 Multi-Cue Zero-Shot Learning with Strong Supervision

zero-shot learning for visual recognition aims at equipping computer vision systems to recognize novel classes without a single training example这里科普一下什么叫 zero-shot learning ,就是以前训练样本中没见过一个类别的物体,现在希望能够识

2016-07-29 10:23:10 914

原创 车辆检索“Deep Relative Distance Learning: Tell the Difference Between Similar Vehicles”

车辆检索最大的难点在于同一型号的车型长得比较像,但作者认为会有一点小的区别,比如下图中的车辆装饰品,破损等细节:深度相对距离学习 对于图像检索,使用深度学习提取特征,作者使用了深度相对距离学习模型,使用了新的损失函数,并且增加了衡量统一型号车辆区别的分支。使用的损失函数coupled cluster loss也很好理解,原理是认为同一辆车的特征在d维空间内应该落在一个圆内,正样本离得近负样本离得稍

2016-07-29 10:07:01 2553

原创 Learning Deep Representations of Fine-Grained Visual Descriptions

CVPR2016 Learning Deep Representations of Fine-Grained Visual Descriptionscode: https://github.com/reedscot/cvpr2016本文提出了一个模型,可以用来干什么了?就是给你一句话,搜出满足这句话的图像怎么实现这个目标了? 分别对图像 和 语句使用 CNN网络,提取出对应的特征,然后结合起来

2016-07-29 09:24:59 3027

原创 Stacked Attention Networks for Image Question Answering

CVPR2016 Stacked Attention Networks for Image Question Answering code : https://github.com/zcyang/imageqa-san本文针对 image question answering (QA)问题 提出了一个 stacked attention networks (SANs) 网络。3 Sta

2016-07-28 09:23:56 1584

原创 LocNet: Improving Localization Accuracy for Object Detection

这篇论文主要目的是提升检测框与目标的吻合度,特别是当IOU比较大时。之前主要使用bbox回归的方法,作者通过给搜索区域的每列或每行,或在目标bbox内分配概率解决,如下图所示:检测方法步骤:1.给定候选框,分配置信度;2.给定候选框,放大得到搜索区域,迭代得到新的更接近目标的候选框,算法流程如下:给定搜索区域R,划分成M个水平区域和竖直区域,返回每个区域的条件概率,考虑了In-Out概率和边界概率两

2016-07-27 17:00:33 3937 5

原创 Neural Module Networks

Neural Module Networks CVPR2016开源代码 http://github.com/jacobandreas/nmn2本文也是针对 Visual question answering 这个问题的,还是用 CNN网络,这里使用一个语义解析器(natural language parser)来动态的决定一个CNN网络,CNN网络有几个模块过程,通过语义解析器,我们动

2016-07-27 11:15:48 1881

原创 Image Question Answering using Convolutional Neural Networ with Dynamic Parameter Prediction

CVPR2016Image Question Answering using Convolutional Neural Networ with Dynamic Parameter Prediction项目网页 http://cvlab.postech.ac.kr/research/dppnet/开源代码 https://github.com/HyeonwooNoh/DPPnet本文主要使用 CN

2016-07-27 10:11:33 614

原创 Generation and Comprehension of Unambiguous Object Descriptions

CVPR 2016https://github.com/mjhucla/Google_Refexp_toolbox本文主要包括两个模块,一个是描述生成,Description Generation ,对于图像中一个区域或特定物体会生成一个没有歧义的描述(known as a referring expression)。另一个模块是 描述理解 Description Comprehension,给定一

2016-07-26 11:27:18 1405

原创 Exploit All the Layers: Fast and Accurate CNN Object Detector with Scale Dependent Pooling 之再阅读

CVPR2016Exploit All the Layers: Fast and Accurate CNN Object Detector with Scale Dependent Pooling and Cascaded Rejection Classifiers本文对基于CNN的物体检测提出了两个技巧来提高速度和精度: 1) scale-dependent pooling (SDP) 就是根

2016-07-25 11:39:07 1973 1

原创 DisturbLabel: Regularizing CNN on the Loss Layer

CVPR 2016本文针对 CNN模型正则化提出了一个简单的算法:DisturbLabel , 就是在每次迭代过程中,我们随机选择一些样本,使用错误的标记值进行训练。我们发现这个简单的方法可以很好的防止CNN模型过拟合。并且可以和 Dropout 一起使用得到更好的效果。

2016-07-25 11:25:29 1378

原创 运行fast-rcnn-windows遇到的问题

1.raise ValueError(str(list(result.keys()))) ValueError: [‘lib’, ‘include’, ‘path’]解决方案: http://www.cnblogs.com/blfshiye/p/4650511.html

2016-07-20 17:24:58 826

转载 The MegaFace Benchmark-1 Million Faces for Recognition at Scale

CVPR2016 MegaFace data, code, and challenge can be found at: http://megaface.cs.washington.edu人脸识别问题貌似已经被解决了,因为在 LFW上面,大家的识别率都是 99%+啦。但是当数据库的规模达到一百万时,识别率就不是很好了。http://www.leiphone.com/news/201606/X

2016-07-20 16:39:43 2913 1

原创 Identity Mappings in Deep Residual Networks

本文是微软团队对深度残差网络的改进 Code is available at: https://github.com/KaimingHe/resnet-1k-layers 原来深度残差网络的一个Residual Units如下图所示 本文分析深度残差网络主要关注于建立一个直接传播信息的通道,不仅在 residual unit 里面,对整个网络也是如此。我们发现如果是

2016-07-15 16:32:19 1636

原创 CNN网络二值化--XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks

XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks本文主要是简化CNN网络,使得CNN网络能够在CPU实时跑起来,但是会牺牲一些精度。本文提出了两个不同的简化网络 :Binary-Weight-Networks 和 XNOR-Networks。Binary-Weight-Networks 只是对CN

2016-07-15 13:55:07 11649

原创 SSD: Single Shot MultiBox Detector 之再阅读

SSD: Single Shot MultiBox Detector 第一版 8 Dec 2015,第二版是30 Mar 2016,主要改进是内容更加详实,实验更加丰富,尤其是和 Faster R-CNN 和 YOLO 做了对比,其优势比较明显。 SSD 一句话就是速度快,效果好! SSD把 候选区域提取取消了。The fundamental improvement in speed comes f

2016-07-14 10:58:27 20158 1

原创 Faster R-CNN 之再阅读

Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks开源代码 https://github.com/ShaoqingRen/faster_rcnn MATLAB https://github.com/rbgirshick/py-faster-rcnn PythonFast

2016-07-12 16:54:38 2798 2

空空如也

cv_family_z的留言板

发表于 2020-01-02 最后回复 2020-01-02

空空如也
提示
确定要删除当前文章?
取消 删除