计算机视觉
文章平均质量分 52
lanbing510
热衷计算机技术,机器智能,爱折腾的博士僧
展开
-
行人检测算法(ICF DPM)&CCV(A Morden Computer Vision Library)的使用&VisualBox下使用Ubuntu
由于最近要用到ICF,DPM等新的行人检测算法,找到了开源库CCV http://libccv.org/tutorial/ ,但代码是在linux平台下的,公司机器又不允许自己装双系统,就使用了Visual Box+Ubuntu来进行实现,具体的实现步骤如下:一、安装VisualBox+Ubuntu1 下载VisualBox https://www.virtualbox.org/原创 2014-11-19 13:10:04 · 9727 阅读 · 5 评论 -
Discriminatively Trained Partbased Models (DPM) 理解
Reference:Object detection with discriminatively trained partbased models. IEEE Trans. PAMI, 32(9):1627–1645, 2010."Support Vector Machines for Multiple-Instance Learning,"Proc. Advances in Ne转载 2014-11-24 16:31:55 · 8137 阅读 · 0 评论 -
特征生成
特征生成 SIFT Bag of Words原创 2014-10-30 21:49:36 · 2980 阅读 · 0 评论 -
K相邻和Kd tree
动机先前写了一篇文章《SIFT算法研究》讲了讲SIFT特征具体是如何检测和描述的,其中也提到了SIFT常见的一个用途就是物体识别,物体识别的过程如下图所示:如上图(a),我们先对待识别的物体的图像进行SIFT特征点的检测和特征点的描述,然后得到了SIFT特征点集合。接下来生成物体目标描述要做的就是对特征点集合进行数据组织,形成一种特殊的表示,其作用是为了加速特征点匹配的过程转载 2013-01-28 15:18:50 · 7261 阅读 · 0 评论 -
CVPapers论文整理工具-开源
一、运行实例相信计算机视觉领域的同道中人都知道这个Computer Vision Resource网站, http://www.cvpapers.com/ 网页部分截图如下:可以看到有太多论文集,比如CVPR2013年就有472篇,自己写了一个小工具,用来筛选感兴趣的论文运行界面如下:输入论文集网址和自己感兴趣的领域点击提交即可,其中关键字可以输入多个,然后程原创 2013-09-10 14:57:33 · 5033 阅读 · 1 评论 -
安装Python的机器学习包Sklearn 出错解决方法
1 首先需要安装Cython,网上下载后进行本地安装 python setup.py install2 下载Sklearn包,https://pypi.python.org/pypi/scikit-learn/0.14.1 ,进行本地安装(使用pip或easy_install总是出错,如can not import murmurhash3_32,最终本地安装成功)3 安装后原创 2014-11-14 21:52:34 · 23559 阅读 · 0 评论 -
训练SVM进行行人检测
正样本来源是INRIA数据集中的96*160大小的人体图片,使用时上下左右都去掉16个像素,截取中间的64*128大小的人体。负样本是从不包含人体的图片中随机裁取的,大小同样是64*128(从完全不包含人体的图片中随机剪裁出64*128大小的用于人体检测的负样本)。SVM使用的是OpenCV自带的CvSVM类。首先计算正负样本图像的HOG描述子,组成一个特征向量矩阵,对应的转载 2014-11-12 18:05:01 · 15783 阅读 · 6 评论 -
多目标跟踪-Multi-Object Tracking
项目是『足球事件检索』。事件是一个 high-level 概念,需要基于一些 low-level 信息来做。后者主要就是一些图像处理的东西了。两个 level 之间,会有一些中间层的信息,比如足球的走向。根据师兄的建议,可以考虑对足球场上的运动员进行多目标跟踪,在跟踪轨迹的基础上抽取一些有用的信息。一来这个项目可能用到 MOT 作为中间的一个处理环节,另一方面有发论文的压力,MOT 或许是一个不错转载 2014-11-10 20:33:26 · 13715 阅读 · 1 评论 -
光流法与KLT
光流法与KLT的解释原创 2014-10-25 11:39:26 · 27465 阅读 · 6 评论 -
运动目标检测知识整理(背景建模 VIBE 背景差分 帧间差分 光流 HOG Adaboost SVM 显著性检测)
运动目标检测一些相关知识的整理(背景建模 VIBE 背景差分 帧间差分 光流 HOG Adaboost SVM 显著性检测)原创 2014-10-24 00:21:15 · 4783 阅读 · 0 评论 -
Real-Time Compressive Tracking 论文笔记
采用压缩感知做的跟踪,实时性非常好,论文笔记原创 2014-10-24 00:38:49 · 2318 阅读 · 0 评论 -
Upper-body detection 源码配置及运行
最近在搞上身检测(Upper-body detection),本文使用了http://groups.inf.ed.ac.uk/calvin/calvin_upperbody_detector/进行上身检测其中作者用到了voc-release 3.1 (DPM)来做上身检测,并综合了VJ的face detector来辅助上身检测。DPM更高版本的代码可以从http://www.cs.be原创 2014-12-05 09:00:35 · 4063 阅读 · 2 评论 -
Theano(Deep Learning Tool) 利用GPU来进行加速的配置及使用
最近使用Theano写了MLP和CNN的程序,由于训练样本大,单靠CPU运算速度so slow;于是乎找到了一台有NAIVID显卡的电脑进行了GPU的配置使用,期间遇到很多问题,记录如下:平台说明:系统:WindowsXPPython:2.7, 建议直接使用 Python(x,y),包含了Theano需要的Numpy等库,省去自己配置Theano: 0.6CUDA:3.原创 2014-12-06 15:09:02 · 16033 阅读 · 0 评论 -
Ubuntu下视频的处理
一 视频下载很多实验数据会从YouTube上下载,我用的工具是youtube-dl1 安装: sudo apt-get install youtube-dl 即可2 配置使用:如果你已经翻墙,直接: youtube-dl http://www.youtube.com/watch?v=ksjfsjfslkjfskfjs 就可以;如果没有翻墙,可以在~/.bashrc中添加 http_原创 2014-12-28 17:51:35 · 4302 阅读 · 0 评论 -
车牌检测及识别 开源代码 OpenALPR配置及使用
最近项目需要,搞起了车牌,先大概做了下调研:检测的基本方法有:1 用边缘检测+轮廓提取+车牌特征进行车牌的检测2 用Harr-like特征或者LBP特征+Adaboost来训练模板用于车牌的检测;还有用神经网络训练的3 两者结合识别的基本方法有:1 用Tesseract.来进行训练2 用车牌上的字符直接训练识别器用到的库是网上的一个开源项目原创 2014-12-28 18:12:21 · 14033 阅读 · 9 评论 -
提升自己的Opencv境界
学习OpenCV的三种境界:(1)乘客级。不会造飞机,会坐飞机也行。将刘、于书中的代码跑一遍;(2)厨师级。吃自助餐。把OpenCV当成菜或佐料,自己烹调;(3)天师级。做张天师,这时OpenCV不过是一个披着画皮的女鬼。以前就看过这段话,今天看Opencv里面决策树的算法,搞的快崩溃了了,各种巧妙的东西,各种内存的分配,各种简洁又复杂的算法........都有TBB的加速,崩转载 2013-04-05 23:39:49 · 1878 阅读 · 0 评论 -
图像处理-模板、卷积的整理
一:什么是卷积离散卷积的数学公式可以表示为如下形式:f(x) = - 其中C(k)代表卷积操作数,g(i)代表样本数据, f(x)代表输出结果。举例如下:假设g(i)是一个一维的函数,而且代表的样本数为G = [1,2,3,4,5,6,7,8,9]假设C(k)是一个一维的卷积操作数, 操作数为C=[-1,0,1]则输出结果f(x)可以表示为 F=[1,2,2,2,2,2,转载 2012-04-04 17:14:45 · 26693 阅读 · 4 评论 -
Linux下Opencv的安装及配置使用
一、安装1 安装cmake及一些依赖库sudo apt-get install cmakesudo apt-get install build-essential libgtk2.0-dev libavcodec-dev libavformat-dev libjpeg.dev libtiff4.dev libswscale-dev libjasper-dev2 安装op原创 2014-12-03 15:50:58 · 67979 阅读 · 3 评论 -
漫谈机器学习经典算法—增强学习与马尔科夫决策过程
公式及图片正常显示的精美排版版请移步http://lanbing510.info/2015/11/17/Master-Reinforcement-Learning-MDP.html写在前面现有的机器学习算法根据模型的学习过程大致可以分为四类:监督式学习,无监督式学习,半监督式学习和增强学习。① 监督式学习:从标记好的训练数据中进行模型的训练,常用来做分类和回归,例如逻辑回归、反向神经网络;② 无监督原创 2015-11-18 20:37:46 · 24364 阅读 · 2 评论 -
漫谈机器学习经典算法—人工神经网络
人工神经网络 深度学习 MLP RBF RBM DBN DBM CNN 整理学习原创 2014-11-07 00:13:53 · 7798 阅读 · 9 评论 -
漫谈机器学习经典算法—理解EM算法
公式显示有问题,可移步http://lanbing510.info/2015/11/12/Master-EM-Algorithm.html写在前面EM(Expectation Maximization 期望最大化)算法是一种迭代算法,用于含有隐变量的概率模型参数的极大似然估计,或极大后验概率估计。其每次迭代由E、M两步构成。下面首先给出一般EM算法的求解过程(怎么做),然后结合一个例子来理解,然后讲原创 2015-11-15 15:46:32 · 7756 阅读 · 7 评论 -
协方差和马氏距离的理解
整理了几篇看着不错的博客。统计学的基本概念方差:很显然,均值描述的是样本集合的中间点,它告诉我们的信息是很有限的,而标准差给我们描述的则是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0,8,12,20]和[8,9,11,12],两个集合的均值都是10,但显然两个集合差别是很大的,计算两者的标准差,前者是8.3,后者是1.8,显然后者较为集中,故其标准差小一些,标准差原创 2013-04-04 12:05:27 · 24261 阅读 · 5 评论 -
漫谈机器学习经典算法—特征提取与特征选择
模式识别 机器学习 特征提取和特征选择原创 2014-10-27 00:35:18 · 72613 阅读 · 27 评论 -
自写图像标注工具 QT+Opencv
前段时间由于工作需要对图像中目标进行像素级标定,自己写的小工具,在此分享给大家环境:QT+Opencv实现实现功能:1 标定任意格式的图像2 可手动绘制轮廓进行标定3 可利用GrabCut进行半自动标定4 支持Hull类型及Poly类型多种轮廓5 支持各种后退重做等快捷键功能6 可记录标定进度及标定所用时间原创 2015-09-06 21:35:05 · 8497 阅读 · 4 评论 -
Normalized Cut的C++代码 Linux Win
由于工作上需要C++版的Normalized Cut 代码,爬遍几乎整个网络,找到了一个比较靠谱的版本,但期间各种配置,终于搞定,做下记录。代码原始版:https://github.com/bsankaran/clutter_segmentation/tree/master/ncuts-evh一、 首先自己在Ubuntu系统上验证了下,配置的时候:1 先下载Boost原创 2015-08-07 18:17:10 · 2556 阅读 · 1 评论 -
模式识别概论
模式识别 入门 概论原创 2014-10-30 23:06:58 · 1921 阅读 · 0 评论 -
高斯函数的一些性质
高斯模糊是一种图像模糊滤波器,它用正态分布计算图像中每个像素的变换。N 维空间正态分布方程为在二维空间定义为其中 r 是模糊半径 (r2 = u2 + v2),σ 是正态分布的标准偏差。在二维空间中,这个公式生成的曲面的等高线是从中心开始呈正态分布的同心圆。分布不为零的像素组成的卷积矩阵与原始图像做变换。每个像素的值都是周围相邻像素值的加权平均。原始像素的值有最大的高斯分布转载 2013-03-08 11:16:21 · 10843 阅读 · 0 评论 -
计算机视觉领域期刊和会议
Computer VisionConf.: Best: ICCV, Inter. Conf. on Computer Vision CVPR, Inter. Conf. on Computer Vision and Pattern Recognition Good: ECCV, Euro. Conf. on Comp. Vis转载 2013-03-07 14:26:34 · 2265 阅读 · 0 评论 -
VS2010+Opencv+SIFT
SIFT的实现有很多版本,具体方式都是那么几个,找个好用的不太容易,因为对于代码不熟练者各种版本用起来都有点水土不服,需要调整调整才行。本人是在VS2010下使用的Rob Hess的源码。一、前提安装Opencv,因该版本的SIFT是基于Opencv的。下载SIFT源码,见Rob Hess的主页(别告诉我不懂英文不知道下载链接在哪,下那个Windows VC++的版本 si转载 2013-01-15 21:10:33 · 14284 阅读 · 23 评论 -
Visual Studio 2010下OpenCv 安装与配置
1准备工作 安装 vs2010安装 OpenCV-2.2.0-win32-vs2010 这个安装文件中已经有了编译好的库,比较方便,不必用cmake自己编译,假设安装目录在C:\Opencv2.2(可到http://www.opencv.org.cn/index.php/Download下载)2 配置Windows环境变量Path将C:\Opencv2.2\bin加入Windo原创 2012-04-03 17:13:51 · 3097 阅读 · 0 评论 -
BMP文件格式
因为公司的主要业务是图像识别相关的,因此对图像处理、识别是我学习的重点。虽然写程序也不少年了,但是对于图像处理领域,我还是一个新兵。对很多基础的概念也还是存在盲区,所以想在边学边做的过程中,对一些概念的梳理和学习心得进行记录。BMP文件格式BMP(Bitmap-File)图形文件,又叫位图文件,是Windows采用的图形文件格式,在Windows环境下运行的所有图象处理软件都支持B转载 2012-11-12 21:11:52 · 40566 阅读 · 6 评论 -
关于VC维的整理
VC维是统计学习理论中的一个核心概念,它是目前为止对函数集学习性能的最好描述指标。VC维对于一个指示函数集来说,如果其生长函数是线性的,则它的VC维为无穷大;而如果它的生长函数以参数为h的对数函数为上界,则函数集的VC维是有限的且等于h。由于VC维是研究人员Vapnik和Chervonenkis在1958年发现的,所以,就取他们两人名字的首字母来来组成了这个名字。研究人员通过分原创 2012-04-09 15:34:20 · 11488 阅读 · 0 评论 -
图像处理中的傅里叶变换
傅立叶变换在图像处理中有非常非常的作用。因为不仅傅立叶分析涉及图像处理的很多方面,傅立叶的改进算法,比如离散余弦变换,gabor与小波在图像处理中也有重要的分量。印象中,傅立叶变换在图像处理以下几个话题都有重要作用:1.图像增强与图像去噪绝大部分噪音都是图像的高频分量,通过低通滤波器来滤除高频——噪声; 边缘也是图像的高频分量,可以通过添加高频分量来增强原始图像的边缘;转载 2012-04-06 08:36:26 · 2359 阅读 · 0 评论 -
图像处理\计算机视觉资源
作图像处理方面的研究工作,最重要的两个问题:其一是要把握住国际上最前沿的内容;其二是所作工作要具备很高的实用背景。解决第一个问题的办法就是找出这个方向公认最牛的几个超级大拿(看看他们都在作什么)和最权威的出版物(阅读上面最新的文献),解决第二个问题的办法是你最好能够找到一个实际应用的项目,边做边写文章。做好这几点的途径之一就是充分利用网络资源,特别是权威网站和大拿们的个人主转载 2012-04-06 08:48:10 · 1206 阅读 · 0 评论 -
机器学习与数据挖掘
机器学习与数据挖掘周 志 华南京大学计算机软件新技术国家重点实验室,南京210093“机器学习”是人工智能的核心研究领域之一, 其最初的研究动机是为了让计算机系统具有人的学习能力以便实现人工智能,因为众所周知,没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能”[1]。事实上,由于“经验”在计算机系统中主要是以数据的形式存在的转载 2010-06-24 22:46:00 · 5093 阅读 · 0 评论 -
机器学习和计算机视觉有关的数学
1. 线性代数 (Linear Algebra):我想国内的大学生都会学过这门课程,但是,未必每一位老师都能贯彻它的精要。这门学科对于Learning是必备的基础,对它的透彻掌握是必不可少的。我在科大一年级的时候就学习了这门课,后来到了香港后,又重新把线性代数读了一遍,所读的是Introduction to Linear Algebra (3rd Ed.) by Gilb转载 2012-03-15 22:20:00 · 5288 阅读 · 2 评论 -
支持向量机基本原理
对于很多分类问题,例如最简单的,一个平面上的两类不同的点,如何将它用一条直线分开?在平面上我们可能无法实现,但是如果通过某种映射,将这些点映射到其它空间(比如说球面上等),我们有可能在另外一个空间中很容易找到这样一条所谓的“分隔线”,将这些点分开。SVM基本上就是这样的原理,但是SVM本身比较复杂,因为它不仅仅是应用于平面内点的分类问题。SVM的一般做法是:将所有待分类的点映射到“高维空间”,转载 2012-03-16 13:07:46 · 23145 阅读 · 0 评论 -
模式识别概述
模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(Supervised Classification)和无监督的分类(Unsupervised Classification)两种。 模式识别(Pattern Recognition)是人类的一项基本智能,在日常生活中,人们经常在进行“模式识别”。随着20世纪40年代计算机的出现以及50年代人工智能转载 2012-03-10 22:06:49 · 2057 阅读 · 0 评论 -
OpenCv合并Mat图
Mat img1 = imread(imageleft, -1);Mat img2 = imread(imageright, -1);Size img_size = img1.size();Mat img_new(img_size.height, img_size.width*2, img1.type() );Mat part;part = img_new(cv::Rect转载 2013-03-08 15:57:48 · 1633 阅读 · 0 评论 -
图像处理与计算机视觉中的经典文章
转自http://blog.csdn.net/dcraw/article/details/7367990自己视野狭小,不敢说全部,只是把自己熟悉的方向中的部分经典文章列出来了。经典的论文,读得怎么透都不过分。有人说关于配准的文章太多了,其实我也不太关注这方面,不过由于它们引用率都比较高,就都列出来了,不过在zip包里一篇都没有。不关注这方面的可以无视之。文档和论文下载地址:转载 2013-02-27 21:51:52 · 2241 阅读 · 1 评论