计算机视觉CV
文章平均质量分 83
GarfieldEr007
这个作者很懒,什么都没留下…
展开
-
胶囊图神经网络
卷积神经网络首先学会识别边界和颜色,然后将这些信息用于识别形状和图形等更复杂的实体。比如在人脸识别上,他们学会从眼睛和嘴巴开始识别最终到整个面孔,最后根据脸部形状特征识别出是不是人的脸。 卷积网络对不同人脸的识别 {% gp 1-3 %} {% endgp %} 1|2深度卷积网络的缺陷CNN 对物体之间的空间关系 (spatial relationship) 的识别能力不强,比如上图中的嘴巴和眼睛换位置了还被识别成人 CNN 对物体旋转之后的识别能力不强 (微微旋转还可以),..转载 2022-02-03 22:50:16 · 2368 阅读 · 1 评论 -
人脸识别最全综述:详解人脸识别技术、人才、趋势
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。通常采用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸。自20世纪下半叶,计算机视觉技术逐渐地发展壮大。同时,伴随着数字图像相关的软硬件技术在人们生活中的广泛使用,数字图像已经成为当代社会信息来源的重要构成因素,各种图像处理与分析的需求和应用也不断促使该技术的革新。根据资料,2017 年生物识别技术全球...转载 2019-11-13 09:23:07 · 7172 阅读 · 0 评论 -
face recognition[翻译][深度学习理解人脸]
本文译自《Deep learning for understanding faces: Machines may be just as good, or better, than humans》。为了方便,文中论文索引位置保持不变,方便直接去原文中找参考文献。近些年深度卷积神经网络的发展将各种目标检测和识别问题大大的向前推进了不少。这同时也得益于大量的标注数据集和GPU的使用,这些方面的发展使...转载 2019-11-12 19:30:27 · 2525 阅读 · 0 评论 -
face recognition[翻译][深度人脸识别:综述]
这里翻译下《Deep face recognition: a survey v4》.1 引言由于它的非侵入性和自然特征,人脸识别已经成为身份识别中重要的生物认证技术,也已经应用到许多领域,如军事,进入,公共安全和日常生活。FR自然在CVPR会议中也占据了十分长的时间。早在1990年代,随着特征脸的提出[157],FR就成为了一个比较热门的研究领域。过去基于特征进行FR的里程碑方法在图1中有...转载 2019-11-11 08:55:10 · 5948 阅读 · 0 评论 -
CVPR 2015 papers
CVPR 2015 CVPR 2015的文章可以下载了,如果链接无法下载,可以在Google上通过搜索paper名字下载(友情提示:可以使用filetype:pdf命令)。Going Deeper With ConvolutionsChristian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet,原创 2015-07-07 17:15:35 · 5543 阅读 · 0 评论 -
CVPR 2013 papers
OralRobust Multi-Resolution Pedestrian Detection in Traffic ScenesJunjie Yan, Xucong Zhang, Zhen Lei, Dong Yi, Shengcai Liao, Stan LiMegastereo: Constructing High-Resolution Stereo Panoramas (proj原创 2015-07-21 12:25:54 · 5448 阅读 · 0 评论 -
CVPR 2012 papers
OralsMicro Phase Shifting (PDF, project)Mohit Gupta, Shree NayarOn Multiple Foreground Cosegmentation (PDF, supplementary material, project)Gunhee Kim, Eric XingFace detection, pose estimation,原创 2015-07-21 12:27:49 · 4775 阅读 · 0 评论 -
CVPR 2011 papers
Paper Awards[Best Paper] Real-time Human Pose Recognition in Parts from Single Depth Images (PDF, supplementary material, videos, project)Jamie Shotton (Microsoft Research Cambridge), Andrew Fit原创 2015-07-21 12:30:55 · 6629 阅读 · 1 评论 -
CVPR 2009 papers
Image and Video Search (oral)Pose Search: retrieving people using their pose (PDF)Vittorio Ferrari, Manuel Marin-Jimenez, Andrew ZissermanEfficient Representation of Local Geometry for Large Scale原创 2015-07-21 12:36:05 · 5007 阅读 · 0 评论 -
CVPR 2014 papers
Accepted OralsReconstructing Storyline Graphs for Image Recommendation from Web Community Photos (project, PDF)Gunhee Kim* (Disney Research), Eric Xing (Carnegie Mellon University)Unsupervised O原创 2015-07-21 12:22:45 · 9656 阅读 · 0 评论 -
CVPR 2010 papers
Object Recognition I: Context (oral)Object-Graphs for Context-Aware Category Discovery (PDF, project)Yong Jae Lee, Kristen GraumanGrouplet: a Structured Image Representation for Recognizing Human原创 2015-07-21 12:33:55 · 6503 阅读 · 0 评论 -
CVPR 2007 papers
Oral - Matching and FeaturesLearning Visual Similarity Measures for Comparing Never Seen Objects (PDF, bibtex)Eric Nowak and Frederic JurieA contextual dissimilarity measure for accurate and effic原创 2015-07-21 12:38:09 · 2838 阅读 · 0 评论 -
CVPR 2008 papers
OralsLearning Patch Correspondences for Improved Viewpoint Invariant Face Recognition (PDF, abstract)Ahmed Bilal Ashraf, Simon Lucey, Tsuhan ChenHuman-Assisted Motion Annotation (PDF, project)Ce原创 2015-07-21 12:37:13 · 4400 阅读 · 0 评论 -
自己整理的计算机视觉领域稍微容易中的期刊(第一版)
模式识别,计算机视觉领域,期刊 (1)pattern recognition letters, 从投稿到发表,一年半时间(2)Pattern recognition 不好中,时间长(3)IEICE Transactions on Information and Systems, 作者中有一个必须是会员。收费高,审稿快。影响因子0.4(4)International Journa转载 2015-11-20 19:01:47 · 1515 阅读 · 0 评论 -
利用Hog特征和SVM分类器进行行人检测
之前介绍过Hog特征(http://blog.csdn.net/carson2005/article/details/7782726),也介绍过SVM分类器(http://blog.csdn.net/carson2005/article/details/6453502 );而本文的目的在于介绍利用Hog特征和SVM分类器来进行行人检测。 在2005年CVPR上,来自法国的研究人员转载 2015-11-20 19:13:14 · 1642 阅读 · 0 评论 -
图像处理与计算机视觉基础、经典以及最近发展
图像处理与计算机视觉基础,经典以及最近发展 By xdyang(杨晓冬xdyang.ustc@gmail.com)一、 绪论转载 2015-11-20 19:40:18 · 1939 阅读 · 0 评论 -
List of 50+ Face Detection / Recognition APIs, libraries, and software
There has been a lot of buzz around Face Recognition since Google Glass was announced. We believe that face recognition will open up a ton of possibilities in how we interact not just with each oth转载 2015-11-21 11:30:37 · 2531 阅读 · 0 评论 -
庖丁解牛TLD
一、庖丁解牛TLD——开篇 最近在网上多次看到有关Zdenek Kalal的TLD的文章,说他做的工作如何的帅,看了一下TLD的视频,感觉确实做的很好,有人夸张的说他这个系统可以和Kniect媲美,我倒是两者的工作可比性不大,实现的方法也不同。但这个哥们做的真的很棒,最可贵的是人家提供了源码可以下载。他相关的工作网上一搜一大片,推荐一个链接http://www.cvchina.ne转载 2015-11-21 19:53:54 · 2333 阅读 · 1 评论 -
计算机视觉Computer Vision网址导航
1常用网站20条常用网站网址,更多点此Google(gfsoso)[直达]计算机视觉网[直达]增强现实资讯[直达]开源中国社区oschina[直达]百度搜索[直达]小木虫,学术科研第一站[直达]计算机视觉论坛[直达]OpenCV中文网[直达]转载 2015-12-11 12:30:41 · 2560 阅读 · 0 评论 -
目标检测的图像特征提取之(一)HOG特征
目标检测的图像特征提取之(一)HOG特征zouxy09@qq.comhttp://blog.csdn.net/zouxy09 1、HOG特征: 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结转载 2015-12-12 12:18:47 · 1071 阅读 · 0 评论 -
目标检测的图像特征提取之(三)Haar特征
目标检测的图像特征提取之(三)Haar特征zouxy09@qq.comhttp://blog.csdn.net/zouxy09 1、Haar-like特征 Haar-like特征最早是由Papageorgiou等应用于人脸表示,Viola和Jones在此基础上,使用3种类型4种形式的特征。Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成转载 2015-12-12 12:21:01 · 985 阅读 · 0 评论 -
目标检测的图像特征提取之(二)LBP特征
目标检测的图像特征提取之(二)LBP特征zouxy09@qq.comhttp://blog.csdn.net/zouxy09 LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietikäinen, 和 D. Harwood转载 2015-12-12 12:19:56 · 1167 阅读 · 0 评论 -
Gray-level Co-occurrence Matrix(灰度共生矩阵)
共生矩阵用两个位置的象素的联合概率密度来定义,它不仅反映亮度的分布特性,也反映具有同样亮度或接近亮度的象素之间的位置分布特性,是有关图象亮度变化的二阶统计特征。它是定义一组纹理特征的基础。 一幅图象的灰度共生矩阵能反映出图象灰度关于方向、相邻间隔、变化幅度的综合信息,它是分析图象的局部模式和它们排列规则的基础。 设f(x,y)为一幅二维数字图象,其大小为M×N,灰度级别为Ng,则转载 2015-11-20 19:32:48 · 2360 阅读 · 0 评论 -
人脸数据库汇总
■Annotated Database (Hand, Meat, LV Cardiac, IMM face) (http://www2.imm.dtu.dk/~aam/)■AR Face Database (http://cobweb.ecn.purdue.edu/~aleix/aleix_face_DB.html)■BioID Face Database (http://www.bioi转载 2015-11-20 18:55:46 · 8761 阅读 · 0 评论 -
以图搜图/图像检索相关资料
基于内容的图片检索(Content Based Image Retrieval, CBIR),也有人称之为以图搜图,是一个很老的研究领域,它是利用机器学习、模式识别、计算机视觉等相关技术对图片的内容进行分析、检测、检索的一种应用。随着近年来模式识别与机器学习的快速发展,该领域又逐渐火热起来,并涌现出很多实际可用的商业系统。同时,越来越多的公司和机构开始涉足该领域,以此来推动以图搜图的快速发展与成长转载 2015-11-20 19:52:37 · 4795 阅读 · 0 评论 -
开源图像检索工具:Caliph&Emir使用方法
Caliph&Emir是基于MPEG7的软件。它是用Java编写的开源软件。采用了lucene完成索引和检索功能。是研究MPEG7标准,图像检索等等方面不可多得的好工具。在此介绍一下它们的基本使用方法。深入的研究还需要分析其源代码。Caliph是一个软件,Emir也是一个软件。官网首页:http://www.semanticmetadata.net/注:查了一下Caliph&Emir的转载 2015-11-19 17:40:12 · 1149 阅读 · 0 评论 -
图像检索中相似度度量公式:各种距离
基于内容的图像检索(Content-Based Image Retrieval)是指通过对图像视觉特征和上下文联系的分析,提取出图像的内容特征作为图像索引来得到所需的图像。相似度度量方法在基于内容的图像检索中需要通过计算查询和候选图像之间在视觉特征上的相似度匹配。因此需要定义一个合适的视觉特征相似度度量方法对图像检索的效果无疑是一个很大的影响。提取的视觉特征大都可以表示成向量的形式,事实上转载 2015-11-19 17:52:49 · 9431 阅读 · 0 评论 -
图像检索:基于形状特征的算法
本文节选自《基于形状特征的图像检索算法研究》 基于形状特征的图像检索算法相对于颜色特征和纹理特征来说,使用的稍微少一些。摘录了其中的几种算法,不做深入剖析了。 形状通常与图像中的特定目标对象有关,是人们的视觉系统对目标的最初认识,有一定的语义信息,被认为是比颜色特征和纹理特征更高一层的特征。形状描述的准确与否是决定图像检索算法优劣的重要因素,一个好的形状描述符应具备独特性、完备性、转载 2015-11-19 17:46:31 · 3524 阅读 · 0 评论 -
累加直方图 Cumulative Histogram
Cumulative HistogramA sample cumulative histogramFigure 12a. A 3D grayscale image (a)Figure 12b. Its cumulative histogram (b)转载 2015-12-28 12:51:33 · 5859 阅读 · 0 评论 -
基于Gabor滤波的纹理分割 Texture Segmentation Using Gabor Filters
This example shows how to use texture segmentation to identify regions based on their texture. The goal is to segment the dog from the bathroom floor. The segmentation is visually obvious because of t转载 2015-12-28 12:54:12 · 3887 阅读 · 0 评论 -
JPEG图像压缩算法流程详解
JPEG是Joint Photographic Exports Group的英文缩写,中文称之为联合图像专家小组。该小组隶属于ISO国际标准化组织,主要负责定制静态数字图像的编码方法,即所谓的JPEG算法。JPEG专家组开发了两种基本的压缩算法、两种熵编码方法、四种编码模式。如下所示:压缩算法:(1)有损的离散余弦变换DCT(Discrete Cosine Transform)(2)无转载 2015-11-20 19:11:01 · 3422 阅读 · 0 评论 -
信息检索(IR)的评价指标介绍-准确率、召回率、F1、mAP、ROC、AUC
在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式: 召回率(Recall) = 系统检索转载 2015-11-20 19:28:33 · 1611 阅读 · 0 评论 -
2013计算机视觉代码合集
注:下面有project网站的大部分都有paper和相应的code。Code一般是C/C++或者Matlab代码。最近一次更新:2013-9-7 一、特征提取Feature Extraction:SIFT [1] [Demo program][SIFT Library] [VLFeat]PCA-SIFT [2] [Project]Affine-SIFT [3]转载 2015-11-21 11:31:08 · 1662 阅读 · 0 评论 -
图像检索公开数据集
搜索了许多CBIR的数据集,后续还会有添加。INRIA HolidaysINRIA Holidays dataset,Herve Jegou等人使用的数据集,该数据集是他们研究所经常度假时拍的图片(风景为主),一共1491张图,500张query(一张图一个group)和对应着991张相关图像,已提取了128维的SIFT点4455091个,visual dictionaries转载 2015-12-28 17:21:47 · 2442 阅读 · 0 评论 -
k-d tree算法
k-d树(k-dimensional树的简称),是一种分割k维数据空间的数据结构。主要应用于多维空间关键数据的搜索(如:范围搜索和最近邻搜索)。应用背景 SIFT算法中做特征点匹配的时候就会利用到k-d树。而特征点匹配实际上就是一个通过距离函数在高维矢量之间进行相似性检索的问题。针对如何快速而准确地找到查询点的近邻,现在提出了很多高维空间索引结构和近似查询的算法,k-d树就是其中一种。转载 2015-12-14 10:13:02 · 985 阅读 · 0 评论 -
TLD(Tracking-Learning-Detection)学习与源码理解之(一)
TLD(Tracking-Learning-Detection)学习与源码理解之(一)zouxy09@qq.comhttp://blog.csdn.net/zouxy09 TLD(Tracking-Learning-Detection)是英国萨里大学的一个捷克籍博士生Zdenek Kalal在其攻读博士学位期间提出的一种新的单目标长时间(long term tra转载 2015-12-14 13:49:50 · 1197 阅读 · 0 评论 -
TLD(Tracking-Learning-Detection)学习与源码理解之(四)
TLD(Tracking-Learning-Detection)学习与源码理解之(四)zouxy09@qq.comhttp://blog.csdn.net/zouxy09 下面是自己在看论文和这些大牛的分析过程中,对代码进行了一些理解,但是由于自己接触图像处理和机器视觉没多久,另外由于自己编程能力比较弱,所以分析过程可能会有不少的错误,希望各位不吝指正。而转载 2015-12-14 13:52:45 · 1110 阅读 · 0 评论 -
TLD(Tracking-Learning-Detection)学习与源码理解之(二)
TLD(Tracking-Learning-Detection)学习与源码理解之(二)zouxy09@qq.comhttp://blog.csdn.net/zouxy09 OpenTLD下载与编译:(1)https://github.com/arthurv/OpenTLD下载得到:arthurv-OpenTLD-1e3cd0b.zip或者在Linux下直接通过git工具转载 2015-12-14 13:50:49 · 1404 阅读 · 0 评论 -
TLD(Tracking-Learning-Detection)学习与源码理解之(五)
TLD(Tracking-Learning-Detection)学习与源码理解之(五) zouxy09@qq.comhttp://blog.csdn.net/zouxy09 下面是自己在看论文和这些大牛的分析过程中,对代码进行了一些理解,但是由于自己接触图像处理和机器视觉没多久,另外由于自己编程能力比较弱,所以分析过程可能会有不少的错误,希望各位不吝指正。而且转载 2015-12-14 13:53:57 · 1037 阅读 · 0 评论 -
TLD(Tracking-Learning-Detection)学习与源码理解之(七)
TLD(Tracking-Learning-Detection)学习与源码理解之(七)zouxy09@qq.comhttp://blog.csdn.net/zouxy09 下面是自己在看论文和这些大牛的分析过程中,对代码进行了一些理解,但是由于自己接触图像处理和机器视觉没多久,另外由于自己编程能力比较弱,所以分析过程可能会有不少的错误,希望各位不吝指正。而且,因为编程很多地转载 2015-12-14 13:55:30 · 1081 阅读 · 0 评论