机器视觉
文章平均质量分 73
曼陀罗彼岸花
毕业小硕,主研机器视觉,图像处理方向,专注于图像分类,识别,机器视觉方面的研究,愿结识广大同道中人,共同学习!
展开
-
纹理特征提取
一幅图像的纹理是在图像计算中经过量化的图像特征。图像纹理描述图像或其中小块区域的空间颜色分布和光强分布。纹理特征的提取分为基于结构的方法和基于统计数据的方法。一个基于结构的纹理特征提取方法是将所要检测的纹理进行建模,在图像中搜索重复的模式。该方法对人工合成的纹理识别效果较好。但对于交通图像中的纹理识别,基于统计数据的方法效果更好。1 LBP纹理特征LBP方法(Local binary原创 2015-05-07 15:48:41 · 35944 阅读 · 0 评论 -
机器视觉核心期刊
1 CVPR (Computer Vision)(Average MAP score: 0.19)CVPR (Computer Vision) 2012( MAP score: 0.0 )TOPRank1Cited by25Are we ready for autonomous转载 2015-10-07 12:00:51 · 7605 阅读 · 0 评论 -
来自西弗吉利亚大学li xin整理的CV代码合集
来自西弗吉利亚大学li xin整理的CV代码合集来自http://blog.csdn.net/suda072605/article/details/21000879#t21Reproducible Research in Computational Science“It doesn't matter how beautiful your theory is, it doesn't转载 2015-12-28 17:56:57 · 2764 阅读 · 0 评论 -
目标检测--LatentSVM和(Deformable Part Model,DPM)
一、综述Deformable Part Model和LatentSVM结合用于目标检测由大牛P.Felzenszwalb提出,代表作是以下3篇paper:[1] P. Felzenszwalb, D. McAllester, D.Ramaman. A Discriminatively Trained, Multiscale, Deformable Part Model. Proce原创 2016-01-11 21:18:54 · 2915 阅读 · 0 评论 -
CVPR 2015 之深度学习总结
Part 1 - AlexNet 和 VGG-Net 摘要-今年的 CVPR 非常的火爆,总共有2800多人参与,相比去年增加了700多人,这与deep learning的异军突起是不无关系的。CVPR 2015 基本是 “the year of deep learning”,有大概70%的文章是关于deep learning的。今年的 CVPR 非常的火爆,总共有2800多人参与,相原创 2016-01-20 11:12:15 · 5124 阅读 · 3 评论 -
2015 CVPR文章总结
CVPR文章列表CVPR 2015 之深度学习文章分析CVPR 2015 之深度学习篇(3贴): http://deepnn.net/viewtopic.php?f=6&t=31 http://deepnn.net/viewtopic.php?f=6&t=32 http://deepnn.net/viewtopic原创 2016-01-20 11:21:06 · 1812 阅读 · 0 评论 -
行人检测资料整理
行人检测具有极其广泛的应用:智能辅助驾驶,智能监控,行人分析以及智能机器人等领域。从2005年以来行人检测进入了一个快速的发展阶段,但是也存在很多问题还有待解决,个人觉得主要还是在性能和速度方面还不能达到一个权衡。1.行人检测的现状(大概可以分为两类)(1).基于背景建模:利用背景建模方法,提取出前景运动的目标,在目标区域内进行特征提取,然后利用分类器进行分类,判断是否包含行人;原创 2016-01-28 22:04:47 · 4548 阅读 · 5 评论 -
DPM(Deformable Parts Model)
目标检测方法(1)基于cascade的目标检测cascade的级联思想可以快速抛弃没有目标的平滑窗(sliding window),因而大大提高了检测效率,但也不是没缺点,缺点就是它仅仅使用了很弱的特征,用它做分类的检测器也是弱分类器,仅仅比随机猜的要好一些,它的精度靠的是多个弱分类器来实行一票否决式推举(就是大家都检测是对的)来提高命中率,确定分类器的个数也是经验问题。这节就来说说改进的原创 2016-01-28 17:21:13 · 6762 阅读 · 0 评论 -
Windows下运行Discriminatively Trained Deformable Part Models代码 Version 4
Windows下运行Discriminatively Trained Deformable Part Models代码 Version 4 Felzenszwalb的Discriminatively Trained Deformable Part Models URL:http://www.cs.brown.edu/~pff/latent/这是目前最好的object dete原创 2016-01-27 14:34:38 · 792 阅读 · 0 评论 -
如何使用MATLAB将c/cpp文件编译成mex32/mex64文件
如何使用MATLAB将c/cpp文件编译成mex32/mex64文件下面是编译步骤:1. 设置编译器(1)在MATLAB命令窗口中运行mex –setup,出现下列提示:Please choose your compiler for building external interface (MEX) files:W原创 2016-01-20 17:23:04 · 6425 阅读 · 3 评论 -
机器视觉code及工具
Feature Detection and DescriptionGeneral Libraries: VLFeat – Implementation of various feature descriptors (including SIFT, HOG, and LBP) and covariant feature detectors (including DoG原创 2015-10-03 19:16:38 · 1165 阅读 · 0 评论 -
从近两年CVPR文章分析计算机视觉领域的最新热点
计算机视觉(Computer Vision)是近十几年来计算机科学中最热门的方向之一,而国际计算机视觉与模式识别大会(Conference on Computer Vision and Pattern Recognition,简称CVPR)绝对是计算机视觉会议中的翘楚。计算机视觉方向的顶级会议CVPR每年都召开,每年CVPR上有哪些让人眼前一亮的研究,又反映出哪些趋势?1.2014原创 2015-10-16 23:07:38 · 4878 阅读 · 0 评论 -
计算机视觉领域稍微容易中的期刊系列(二)
表1. 适合于图像处理方向的SCI期刊杂志列表ISSN期刊名出版周期1057-7149IEEE TRANSACTIONS ON IMAGE PROCESSINGMonthly1070-9908IEEE SIGNAL PR转载 2015-07-28 17:36:30 · 9368 阅读 · 0 评论 -
颜色特征提取方法
计算机视觉的特征提取算法研究至关重要。在一些算法中,一个高复杂度特征的提取可能能够解决问题(进行目标检测等目的),但这将以处理更多数据,需要更高的处理效果为代价。而颜色特征无需进行大量计算。只需将数字图像中的像素值进行相应转换,表现为数值即可。因此颜色特征以其低复杂度成为了一个较好的特征。在图像处理中,我们可以将一个具体的像素点所呈现的颜色分多种方法分析,并提取出其颜色特征分量。比如通过手工标原创 2015-05-07 15:48:54 · 1980 阅读 · 0 评论 -
Table of results for Caltech 101 dataset
Table of results for Caltech 101 dataset<div entry-content"="" id="post-body-1892831501321578741" itemprop="description articleBody" style="width: 668px; line-height: 1.4; font-size: 15px; p转载 2015-05-28 16:05:24 · 1249 阅读 · 0 评论 -
何恺明经典去雾算法 还北京一个碧洗蓝天?
一:由简至美的最佳论文(作者:何恺明 视觉计算组)【视觉机器人:个人感觉学习他的经典算法固然很重要,但是他的解决问题的思路也是非常值得我们学习的】那是2009年4月24日的早上,我收到了一封不同寻常的email。发信人是CVPR 2009的主席们,他们说我的文章获得了CVPR 2009的最佳论文奖(Best Paper Award)。我反复阅读这封邮件以确认我没有理解错误。这真是转载 2015-07-12 16:34:48 · 2294 阅读 · 1 评论 -
机器视觉代码集合
机器视觉代码集合Feature Detection and DescriptionGeneral Libraries: VLFeat – Implementation of various feature descriptors (including SIFT, HOG, and LBP) and covariant feature detectors (inclu转载 2015-07-28 10:28:28 · 847 阅读 · 0 评论 -
神奇的图像算法
上次介绍的Google相似图片搜索的原理,是利用数学算法,进行高难度图像处理的一个例子。事实上,图像处理的数学算法,已经发展到令人叹为观止的地步。Scriptol列出了几种神奇的图像处理算法如下:一、像素图生成向量图的算法数字时代早期的图片,分辨率很低。尤其是一些电子游戏的图片,放大后就是一个个像素方块。Depixelizing算法可以让低分辨率的像素图转化为高转载 2015-07-28 18:01:20 · 1972 阅读 · 0 评论 -
计算机视觉与图像处理的 Matlab/Octave 代码集合
此图片来自http://www.csse.uwa.edu.au/~pk/research/matlabfns/,它收集了很多用于计算机视觉和图像处理的 Matlab/Octave 代码。 尤其是对于打算使用开源免费的 Matlab 替代版 Octave 的人,此文更重要。补充:Matlab 是商业收费的软件。国外的版权意识是很强的。常看到一些出去的学生和访学谈到国外学者要是买不起昂贵的 M原创 2015-07-28 17:43:08 · 3495 阅读 · 0 评论 -
Boosting,AdaBoost ,Online Boosting,online Adaboost介绍
Boosting,AdaBoost ,Online Boosting,online AdaboostBoosting Boosting这其实思想相当的简单,大概是,对一份数据,建立M个模型(比如分类),一般这种模型比较简单,称为弱分类器(weak learner)每次分类都将上一次分错的数据权重提高一点再进行分类,这样最终得到的分类器在测试数据与训练数据上都可以得到比原创 2015-08-28 18:05:27 · 1330 阅读 · 0 评论 -
HOG特征
HOG特征概述HOG即histogram of oriented gradient, 是用于目标检测的特征描述子,该技术将图像局部出现的方向梯度次数进行计数,该方法和边缘方向直方图、scale-invariant feature transform类似,不同的是hog的计算基于一致空间的密度矩阵来提高准确率。Navneet Dalal and Bill Triggs首先在05年的CVP原创 2015-08-03 15:39:27 · 6097 阅读 · 0 评论 -
Object Detection----- Discriminatively Trained Part Based Models
最近研究对象检测,拜读了下对象检测经典文章系列,project link:http://www.cs.berkeley.edu/~rbg/latent/index.html,现在已经更新到第五版了。原文有20页,很长,研究几周可能都云里雾里,中文翻译版本可以参考:使用判别训练的部件模型进行目标检测 详细通俗易懂带解释的版本可参考:http://zhangliliang.com/原创 2015-07-29 20:55:42 · 990 阅读 · 0 评论 -
关于Object Bank的几篇文章解析
1. Object Bank: A High-Level Image Representation for Scene Classification & Semantic Feature Sparsification 这是10年NIPS上的一篇文章,它指出了对于场景分类的一种新的方向。 文章在Abstract就提出了,尽管图片low-level的特征在原创 2016-02-22 16:14:26 · 2577 阅读 · 0 评论 -
BOW 原理及代码解析
引言最初的Bag of words,也叫做“词袋”,在信息检索中,Bag of words model假定对于一个文本,忽略其词序和语法,句法,将其仅仅看做是一个词集合,或者说是词的一个组合,文本中每个词的出现都是独立的,不依赖于其他词 是否出现,或者说当这篇文章的作者在任意一个位置选择一个词汇都不受前面句子的影响而独立选择的。Bag-of-words模型是信息检索原创 2016-04-13 15:37:01 · 27239 阅读 · 6 评论 -
Bag of Features (BOF)图像检索算法
Bag of features(Bof)一种是用于图像和视频检索的算法。此算法对于不同角度,光照的图像,基本都能在图像库中正确检索。检索就要进行比对。两幅不同的图像如何比对,比对什么,这就需要提炼出每幅图像中精练的东西出来进行比较。正如超市中的条形码,就能很好的反映出一件商品的所有特征。因此概括的来说,bof就是生成每幅图像的“条形码”来进行检索。实验中,我们有一个包含100幅图像的小型图转载 2016-04-13 15:49:10 · 6536 阅读 · 1 评论 -
DPM(Deformable Parts Model)原理及代码分析
DPM(Deformable Parts Model)Reference:Object detection with discriminatively trained partbased models. IEEE Trans. PAMI, 32(9):1627–1645, 2010."Support Vector Machines for Multiple-Instance转载 2016-01-11 20:37:48 · 8120 阅读 · 0 评论 -
SVM分类器训练的HOG行人检测
正样本来源是INRIA数据集中的96*160大小的人体图片,使用时上下左右都去掉16个像素,截取中间的64*128大小的人体。负样本是从不包含人体的图片中随机裁取的,大小同样是64*128(从完全不包含人体的图片中随机剪裁出64*128大小的用于人体检测的负样本)。SVM使用的是OpenCV自带的CvSVM类。首先计算正负样本图像的HOG描述子,组成一个特征向量矩阵,对应的转载 2016-03-12 22:55:09 · 2275 阅读 · 1 评论 -
文本无关的声纹识别 验证
文本无关的声纹识别 验证By DakeDake的专栏:www.glade.tk 一、声纹识别简介声纹是指能惟一识别某人或某物的声音特征,是用电声学仪器显示的携带言语信息的声波频谱。虽然人的发音器官生理构造总的是相同的,但人的语言产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的器官——舌、牙齿、喉头、肺、鼻腔在尺寸和形态等方面,每两转载 2015-01-12 10:29:57 · 5003 阅读 · 0 评论 -
斯坦福大学深度学习与自然语言处理第一讲:引言
斯坦福大学深度学习与自然语言处理第一讲:引言斯坦福大学在三月份开设了一门“深度学习与自然语言处理”的课程: CS224d: Deep Learning for Natural Language Processing ,授课老师是青年才俊 Richard Socher ,他本人是德国人,大学期间涉足自然语言处理,在德国读研时又专攻计算机视觉,之后在斯坦福大学攻读博士学位,拜师NLP领转载 2015-05-25 11:40:32 · 2262 阅读 · 0 评论 -
基于CNN的人脸 性别、年龄识别
CNN应用之性别、年龄识别原文地址:http://blog.csdn.net/hjimce/article/details/49255013作者:hjimce一、相关理论 本篇博文主要讲解2015年一篇paper《Age and Gender Classification using Convolutional Neural Networks》,个人感觉这篇文献没啥难度,只要懂得Alexnet,转载 2017-01-05 16:03:45 · 12325 阅读 · 3 评论 -
智能制造时代的机器视觉
工业4.0离不开智能制造,智能制造离不开机器视觉。2015年我国机器视觉市场全球占比8.3%,增速超20%,机器视觉为我国工业自动化打开“新视界”。智能制造的视觉入口◆◆ ◆ 简介及分类 机器视觉是指利用相机、摄像机等传感器,配合机器视觉算法赋予智能设备人眼的功能,从而进行物体的识别、检测、测量等功能。机器视觉可以分为工业视觉、计算机视觉两类。 构成及原理 机器视觉系统一般由灯源、镜头、转载 2017-02-23 11:32:09 · 2919 阅读 · 0 评论 -
机器视觉技术原理解析及解决方案
机器视觉技术原理解析及解决方案机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是指通过机器视觉产品(即图像摄取装置,分 CMOS 和CCD 两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。 食品行业机器视觉系统 概述 机器视觉(Mach转载 2017-02-23 12:34:54 · 28377 阅读 · 0 评论 -
即时定位与地图构建(SLAM)与基于视觉的SLAM(VSLAM)
即时定位与地图构建(SLAM)的相关研究即时定位与地图构建(SimultaneousLocalization AndMapping)指的是机器人在自身位置不确定的条件下,在完全未知环境中创建地图,同时利用地图进行自主定位和导航。SLAM问题可以描述为:机器人在未知环境中从一个未知位置开始移动,在移动过程中根据位置估计和传感器数据进行自身定位,同时建造增量式地图。(1)定位(localization转载 2017-02-15 17:49:05 · 65990 阅读 · 3 评论 -
激光雷达应用领域
激光雷达具备独特的优点,如极高的距离分辨率和角分辨率、速度分辨率高、测速范围广、能获得目标的多种图像、抗干扰能力强、比微波雷达的体积和重量小等。这使得激光雷达能精确测量目标位置(距离和角度)、运动状态(速度、振动和姿态)和形状,探测、识别、分辨和跟踪目标。自1961年科学家提出激光雷达的设想,历经 40余年,激光雷达技术从最简单的激光测距技术开始,逐步发展了激光跟踪、激光测速、激光扫描成像、激光多原创 2017-03-06 15:20:26 · 29028 阅读 · 2 评论 -
LightRNN:高效利用内存和计算的循环神经网络
选自arXiv.org机器之心编译摘要循环神经网络(RNN)已经在许多自然语言处理任务上取得了最出色的表现,比如语言建模和机器翻译。然而当词汇量很大时,RNN 模型会变得很大(可能超过 GPU 最大的内存能力),这样训练将变得很低效。在这项工作中,我们提出一种全新的方法来解决这一挑战。其中的关键思想是使用二分量(2-Component(2C))共享的词表征的嵌入(embedding for wor转载 2016-11-02 23:35:32 · 3214 阅读 · 0 评论 -
循环神经网络(RNN, Recurrent Neural Networks)介绍
原文:http://www.wildml.com/2015/09/recurrent-neural-networks-tutorial-part-1-introduction-to-rnns/, 基于此文,加入了一些新的内容与一些自己的理解:http://blog.csdn.net/heyongluoyao8/article/details/48636251原创 2016-11-02 23:30:21 · 1508 阅读 · 0 评论 -
基于深度学习的目标检测新作
写在前面研究DPM大半年了,实验也做过,工程项目也应用过,发现针对复杂背景的对象检测的效果不是很好,而且由于HOG特征提取和多个部件滤波器的特征提取,造成检测速度很慢,难以用在视频的对象检测上。最近看到了CVPR的一些对象检测的新进展,感觉很有领悟,趋向于基于深度学习的路线,收集了一些资料,在研究中。 上边左侧的这张图,从图中你看到了什么物体?他们在什么位置?这还原创 2016-08-19 16:22:13 · 6416 阅读 · 2 评论 -
ViBe算法原理和代码解析
ViBe - a powerful technique for background detection and subtraction in video sequences算法官网:http://www2.ulg.ac.be/telecom/research/vibe/描述:ViBe是一种像素级视频背景建模或前景检测的算法,效果优于所熟知的几种算法,对硬件内存占用也少。原创 2016-01-11 21:32:12 · 67050 阅读 · 25 评论 -
行人检测方法代码汇总
序号文章简介论文 出处02012年PAMI登的行人检测的综述性文章:pedestrian detection an evaluation of the state of the art 作者:Piotr Dollar文中对比了很多最新的行人检测的算法。这篇论文简称为PAMI2012pedest转载 2016-07-22 15:38:59 · 10426 阅读 · 2 评论 -
图像处理代码库
通用库/General LibraryOpenCV无需多言。RAVLRecognition And Vision Library. 线程安全。强大的IO机制。包含AAM。CImg很酷的一个图像处理包。整个库只有一个头文件。包含一个基于PDE的光流算法。图像,视频IO/Image, Video IOFreeImageDevILImageMa转载 2016-07-22 15:48:47 · 1373 阅读 · 0 评论